「个性化」图像生成时代来了！六大顶尖高校联手发布全新Gen4Gen框架,图像,文本

「个性化」图像生成时代来了！六大顶尖高校联手发布全新Gen4Gen框架

-图像
 +个性化 +概念
 -文本 +模型

04-21 09:30...我们在CustomDiffusion的基础上提供了一个简单的基线，其中包含经验性提示策略，供未来的研究人员在MyCanvas上进行评估。实验结果表明，通过改进数据质量和提示策略，可以显著提高多概念个性化图像生成的质量，而无需对模型架构或训练算法进行任何修改。结果也证明，chaining基础模型可能是生成高质量数据集的一... 0
Meta重大发布！挑战OpenAI

+概念车 +亮相
 +家族 +北京
 +模型

04-20 02:40...（来源/Meta）根据Meta展示的手机操作画面，用户在和朋友计划出行时，可以直接在聊天应用程序内“艾特”@MetaAI，帮助客户寻找旧金山可以看到日落的野餐地点，或者在日本旅游时寻找最佳的观赏樱花地点。Meta首席产品官克里斯·考克斯说：“最终的目标是帮助客户摆脱烦恼，让客户的生活变得更轻松，无论是帮助工作，还是写东... 0
MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

+数学 +视觉
 +能力 +模态
 -文本

04-20 02:20...论文：主页：代码：数据集：题目：MATHVERSE:DoesYourMulti-modalLLMTrulySeetheDiagramsinVisualMathProblems?值得一提的是，这项研究在当日的HuggingFaceDailyPaper中排名第一，并在推特上引发了广泛的讨论，浏览量高大10K+。2、关键发现... 0
一键生成图像 / 文本效果，Adobe Express 手机修图应用获 Firefly AI 特性更新

-文本
 +模板 -图像
 +一键 +效果

04-19 23:50...主要为这款应用添加了FireflyAI功能。IT之家获悉，用户目前可以在应用中使用FireflyAI生成一系列图像、文本效果，AI填空等功能，具体应用更新内容如下：视频：用户可以用应用自带的独特模板开始，然后利用FireflyAI以100多种语言生成实时、高度准确、可编辑和可定制的字幕，制作令人惊叹的视频。文本到图像：... 0
曾爆火的 InstantID又有了新玩法：风格化图像生成，已开源

+风格 -图像
 +方法 +特征
 +玩法

04-14 15:40...论文：InstantStyle:FreeLunchtowardsStyle-PreservinginText-to-ImageGeneration论文地址：项目主页：代码链接：地址：作者在文中花了较大篇幅介绍动机，（1）首先风格是欠定的，没有清晰的标准来定义，它囊括众多元素，比如色彩、氛围、材质、布局等，即使是人工评价... 0
CVPR 2024

-图像
 +场景 -文本
 +训练 +区域

04-14 15:20...基于预训练扩散模型进行3D场景编辑的主流方法主要分为两类。其一，是使用图像编辑模型迭代地更新数据集中的图像，但是受限于图像编辑模型的能力，会在部分编辑情形下失效。其二，则是利用分数蒸馏采样（SDS）损失对场景进行编辑，但由于文本和场景之间的对齐问题，这类方法在真实场景中无法直接适配，会对非编辑区域造成不必要的修改，往往... 0
Sora神话：迄今最具破坏性的网络威胁？

+模型 +人工智能
 +制作 +物理
 -文本

03-27 17:30...OpenAI将视频片段分解成视觉的“时空补丁”(spacetimepatches)，Sora的转换器架构可以对其进行处理。然而，与任何突破性技术一样，Sora也有自己的局限性。尽管该模型具有先进的功能，但有时仍难以准确模拟更为复杂的场景的物理特性。这可能导致视觉效果虽给人留下深刻印象，但偶尔也会违背物理定律或无法准确呈... 0
CMU朱俊彦、Adobe新作：512x512图像推理，A100只用0.11秒

+车成
 +烫手山芋 +二手车
 +新能源 -图像

03-23 00:00...他们将vanilla潜在扩散模型的各个模块整合到拥有小的可训练权重的单个端到端生成器网络，从而增强模型保留输入图像结构的能力，同时减少过拟合。研究者推出了CycleGAN-Turbo模型，在未成对设置下，该模型可以在各种场景转换任务中优于现有基于GAN和扩散的方法，比如昼夜转换、添加或移除雾雪雨等天气效果。同时，为了验... 0
已逝明星被“AI复活”引热议，家属可提起诉讼维权

+维权 +家属
 +明星 +技术
 +逝者

03-19 08:40...这种行为是否触犯法律？需要承担哪些法律责任？“AI‘复活’等技术都属于深度合成技术”，北京市京都律师事务所安璟律师介绍，我国AI技术在2022年11月25日由国家互联网信息办公室、工业和信息化部、公安部联合颁布的《互联网信息服务深度合成管理规定》中有较为明确的概念：“深度合成技术，是指利用深度学习、虚拟现实等生成合成类... 0
Sora神话：迄今最具破坏性的网络威胁？

+模型
 +人工智能 +制作
 +物理 -文本

03-19 05:30...OpenAI将视频片段分解成视觉的“时空补丁”(spacetimepatches)，Sora的转换器架构可以对其进行处理。然而，与任何突破性技术一样，Sora也有自己的局限性。尽管该模型具有先进的功能，但有时仍难以准确模拟更为复杂的场景的物理特性。这可能导致视觉效果虽给人留下深刻印象，但偶尔也会违背物理定律或无法准确呈... 0
跟科幻片一样！OpenAI只用13天给机器人加上了GPT，从此无比“接近人类”

+机器人 +沥水
 +模型 +苹果
 +科幻片

03-14 03:20...到现在面前这个科技感满满的“人形GPT”仅仅用了13天。而且据FigureAI创始人BrattAdcock称，所有这些行为都没有经过远程操作，而是通过机器人的自我学习而来。并且以正常的1.0倍速连续拍摄，没有加速、没有剪辑，所见即所得。可以感受到视频中Figure01的速度已经快要接近人类。具体来看，此次Figure0... 0
OpenAI 机器人炸裂登场！ChatGPT 终于有身体了，能说会看还能做家务

+机器人
 +模型 +模态
 +家务 -图像

03-14 03:10...视频展示了端到端神经网络的应用（end-to-endneuralnetworks）。在此过程中没有使用遥控器（teleop）。视频是以实际速度（1.0倍速）拍摄的，并且是连续不断的。如您在视频中看到的，机器人的速度有了显著的提升，我们正在逐步达到与人类相似的速度。无需遥控，自学成才那么Figure01是怎么做到的呢？F... 13
Claude 3为何能媲美GPT

+模型 +人工智能
 +测试 -图像
 +基准

03-13 20:20...Claude问世，7月Claude2发布，但是彼时并未引起太大的水花。因为每次，Anthropic在性能方面都略微落后于OpenAI的最佳模型，但在上下文窗口长度方面超过OpenAI。随着Claude3的发布，Anthropic的性能或许可以与OpenAI一较高下了。根据Anthropic的说法，Claude3Opus... 12
视频生成新模型Sora的突破与风险

+人工智能 +模型
 -文本 +领域
 -图像

03-13 02:30...人工智能在视频生成领域的巨大发展前景，为塑造影视产业新业态打开大门，同时恐将颠覆现存影视产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工，因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天，主营图像处理、视频制作软件的奥多比公司（Adobe）股价应声下跌超过7%。... 0
复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

+模态 +模型
 -图像 +语音
 -文本

03-06 00:00...例如给出一段语音prompt，AnyGPT能够生成语音、图像、音乐形式的综合响应：其中，AnyGPT生成的两段音乐如下：给出文本+图像形式的prompt，AnyGPT能够按照prompt要求生成音乐：其中，AnyGPT生成的三段音乐如下：论文地址：项目主页：方法简介AnyGPT利用离散表征来统一处理各种模态，包括语音、... 1
Claude 3为何能媲美GPT

+模型
 +人工智能 +测试
 -图像 +基准

03-05 19:40...Claude问世，7月Claude2发布，但是彼时并未引起太大的水花。因为每次，Anthropic在性能方面都略微落后于OpenAI的最佳模型，但在上下文窗口长度方面超过OpenAI。随着Claude3的发布，Anthropic的性能或许可以与OpenAI一较高下了。根据Anthropic的说法，Claude3Opus... 0
视频生成器Sora让人喜忧交加

 -文本
 +模型 -图像
 +技术 +饼干

02-29 20:50...或将文本与图像相结合，来创建长达60秒的视频，而且是一镜到底。比如一段演示视频依据如下文字描述生成：一位时尚女性漫步于充满城市标牌的东京街道上，道路两边霓虹灯闪烁，透出阵阵暖意。Sora不仅准确呈现了细节，还生成了具有丰富情感的角色。目前OpenAI官网上已更新了48个视频，包括一只狗在雪地里嬉戏，车辆在路上行驶，以及... 0
视频生成新模型Sora的突破与风险

 +人工智能
 +模型 -文本
 +领域 -图像

02-29 20:40...Sora再次凸显人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大发展前景，为塑造影视产业新业态打开大门，同时恐将颠覆现存影视产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工，因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天，主营图像处... 1
Sora火了，要鼓掌也要警惕

 +人工智能
 +模型 -文本
 +领域 -图像

02-29 00:00...Sora再次凸显人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大发展前景，为塑造影视产业新业态打开大门，同时恐将颠覆现存影视产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工，因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天，主营图像处... 1
新闻分析｜视频生成新模型Sora的突破与风险

+人工智能
 +模型 -文本
 +领域 -图像

02-25 20:30...恐将颠覆现存影视产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工，因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天，主营图像处理、视频制作软件的奥多比公司（Adobe）股价应声下跌超过7%。虽不是第一家涉足文本转视频领域的公司，但Sora的推出使OpenAI在这... 0
Sora来了，会砸掉谁的饭碗？存在哪些隐患？

+人工智能 +模型
 -图像 +官网
 +饭碗

02-22 02:30...Sora还能够根据静态图像生成视频，扩展现有视频或填充缺失的帧。OpenAI说，Sora能深刻地理解语言，不仅理解用户文本提示，还理解所述事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要与现实世界交互的问题。”不过，OpenAI官网晒出的视频作品是Sora创造... 0
视频生成新模型Sora的突破与风险

+人工智能 +模型
 -文本 +领域
 -图像

02-21 20:00...人工智能在视频生成领域的巨大发展前景在为塑造影视产业新业态打开大门的同时，恐将颠覆现存影视产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工，因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天，主营图像处理、视频制作软件的奥多比公司（Adobe）股价应声下跌超过7%... 1

« 1 2 3 4 »