... 2024-04-30 08:50 .. 没有其他输入方式——还没有实现多模态输入。
这一点很重要,因为尽管Sora因其生成结果中的对象一致性而受到称赞,但目前还没有任何方法来帮助匹配两个镜头(即两次生成)的内容。
即使第二次运行相同的prompt,生成结果也会不同。
Patrick介绍说:「我们尽可能做到的是在我们的prompt中给出超级详细的描述,例如解释角色的服装、气球的类型。
这是我们获得一致性的方法。
从一个镜头到另一个镜头/一次生成到下一次生成,还没有完全控制一致性的方法。
」单个视频片段的确可以展现Sora令人惊叹的技术,但使用这些片段取决于你对隐式或显式镜头生成的理解。
假设你要求Sora在厨房里进行一个长镜头跟踪拍摄,桌子上有一个香蕉。
在这种情况下,它将依赖其对「香蕉属性」的隐式理解来生成一个展示香蕉的视频。
通过训练,Sora已经学习了一些香蕉属性:比如「黄色」、「弯曲」、「有深色的末端」等等。
.. UfqiNews ↓
1
本页Url
🤖 智能推荐