无需训练即可大幅提升SAM 2!SAM2Long来了,港中文上海AI Lab出品,掩码

无需训练即可大幅提升SAM 2!SAM2Long来了,港中文上海AI Lab出品

+上海 +内存
 -掩码 +集上
 +分数

11-05 12:10...SAM2会在每个时间步t上维护一个内存库，存储最近N帧的特征。每个内存条目包含空间嵌入和对象指针，通过这些信息，SAM2能够生成当前帧的分割掩码，并预测掩码的IoU分数和遮挡分数。SAM2采用贪婪选择策略，选择最高IoU的掩码作为最终预测，并存储其对应的内存指针。2.多路径记忆树结构与不确定性处理为了提高SAM2在长视... 0
机器人策略学习的Game Changer？伯克利提出Body Transformer

+架构
 +机器人 +节点
 -掩码 +编码器

08-19 16:10...其在注意力层上使用高度稀疏的掩码，以防止每个节点关注其直接近邻之外的部分。将多个结构相同的BoT层连接起来，就能汇集整个图的信息，这样便不会损害该架构的表征能力。BoT在模仿学习和强化学习方面都表现不俗，甚至被一些人认为是策略学习的「GameChanger」。BodyTransformer如果机器人学习策略使用原始Tr... 2
LeCun怒斥Sora不能理解物理世界！Meta首发AI视频世界模型V

+模型
 +预测 +世界
 +架构 -掩码

02-18 22:30...论文地址：看到下面视频中的动作时，会说「将纸撕成两半」。再比如，翻看笔记本的视频被遮挡了一部分，V-JEPA便能够对笔记本上的内容做出不同的预测。值得一提的是，这是V-JEPA在观看200万个视频后，才获取的超能力。实验结果表明，仅通过视频特征预测学习，就能够得到广泛适用于各类基于动作和外观判断的任务的「高效视觉表示」... 1
手把手教你，从零开始实现一个稀疏混合专家架构语言模型（MoE）

+专家
 +模型 +混合
 +架构 +注意力

02-12 21:40...Linearnum_experts)#nn.Linear4)logits=topkgate_linear(mh_outputtop_k_indices=logits.topkdim=-1top_k_indices#output:(tensor([[[0-0[00[00[0-0[[0-0[00[00[00grad_fnT... 1
微软亚研提出TinyMIM，用知识蒸馏改进小型ViT

+人工智能 +货币
 +市场 +模型
 -掩码

09-01 23:10...和基于掩码重建的方法MAE，以及监督式学习的方法从头开始训练的DeiT作比较。MAE在模型比较大的时候有显著的性能提升，但是在模型比较小的时候提升幅度有限甚至会伤害模型的最终效果。我们的方法TinyMIM在不同模型的大小上都有大幅提升。我们的贡献如下：1.蒸馏的目标（Distillationtargets）:1）蒸馏t... 3
分割一切模型SAM首篇全面综述：28页、200

+模型
 +对象 +综述
 -掩码 +修复器

05-22 23:40...SAM[20]可以通过简单的提示如点或框来生成准确的掩码，可以帮助辅助图像编辑场景。InpaintAnything(IA)[39]设计了一个流程，通过结合SAM的优势、最先进的图像修复器[99]，以及AI生成的内容模型[103]，来解决与修复相关的问题。这个流程如图3所示。对于对象移除，该流程由SAM和最先进的修复器组... 18

« 1 »

无需训练即可大幅提升SAM 2!SAM2Long来了,港中文 上海AI Lab出品

机器人策略学习的Game Changer？伯克利提出Body Transformer

LeCun怒斥Sora不能理解物理世界！Meta首发AI视频世界模型V

手把手教你，从零开始实现一个稀疏混合专家架构语言模型（MoE）

微软亚研提出TinyMIM，用知识蒸馏改进小型ViT

分割一切模型SAM首篇全面综述：28页、200

无需训练即可大幅提升SAM 2!SAM2Long来了,港中文上海AI Lab出品