... 2024-01-22 00:30 .. 将弱对齐的CLIP特征替换为强语义的人脸特征;(2)人脸图像的特征在Cross-Attention中作为ImagePrompt嵌入;(3)提出IdentityNet来对人脸施加强语义和弱空间的条件控制,从而增强ID的保真度以及文本的控制力。
下图为利用InstantID进行风格化的结果,输入仅为最左侧的人物图像。
文章的主要贡献如下:(1)InstantID作为一种全新的ID保留方法,有效弥补了训练效率与ID保真度之间的差距。
(2)InstantID是可插拔的,与目前社区内文生图基础模型、LoRAs、ControlNets等完全兼容,可以零成本地在推理过程中保持人物ID属性。
此外,InstantID保持了良好的文本编辑能力,使ID能够丝滑地嵌入到各种风格当中。
(3)实验结果表明,InstantID不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter- .. UfqiNews ↓
11
本页Url
🤖 智能推荐