李飞飞空间智能之后，上交、智源、北大提出空间大模型SpatialBot,深度图

李飞飞空间智能之后，上交、智源、北大提出空间大模型SpatialBot

-深度图 +深度
 +模型 +空间
 +场景

08-08 03:40...在这个BerkerlyUR5DemonstrationDataset场景中，即使是GPT-4o或人类，都无法从单张RGB图像中判断机械爪是否碰到了目标物体，比如借助深度信息，将深度图直接给GPT-4o看的话，也无法判断，因为它不能理解深度图。SpatialBot通过对RGB-Depth的理解，可以准确获得机械爪和目标物... 0
更高清写实的人体生成模型HyperHuman来了，基于隐式结构扩散，刷新多项SOTA

+人体 +模型
 -深度图 +法向
 +结构

10-31 03:00...核心方法为了引入人体骨架图以进行姿态控制，最简单的方法是通过特征残差或输入串联。然而，这种做法仍然存在几个问题：（1）稀疏关键点仅描绘了粗略的人体结构，而忽略了细粒度的人体几何结构和前景-背景关系。此外，原始的扩散模型训练仅由RGB信号进行监督，无法获得数据集图片中蕴含的结构信息。（2）图像RGB和结构表示在空间上对齐... 0
英特尔AI模型可根据文本生成3D图像

+文本 +图像
 +模型 +英特尔
 -深度图

06-27 20:40...通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展，特别是在生成式AI方面。然而，当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2DRGB图像的现有扩散模型不同，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比，LDM3D在... 8

« 1 »

李飞飞空间智能之后，上交、智源、北大提出空间大模型SpatialBot

更高清写实的人体生成模型HyperHuman来了，基于隐式结构扩散，刷新多项SOTA

英特尔AI模型可根据文本生成3D图像