清华、华为等提出iVideoGPT：专攻交互式世界模型,模态,模型

清华、华为等提出iVideoGPT：专攻交互式世界模型

-模型 +世界
 +预测 +训练
 +架构

05-29 03:20...来自清华大学、华为诺亚方舟实验室、天津大学的研究者提出了iVideoGPT（InteractiveVideoGPT），这是一个可扩展的自回归Transformer框架，它将多模态信号（视觉观察、动作和奖励）集成到一系列token中，通过预测下一个Token使智能体能够进行交互体验。iVideoGPT采用新颖的压缩tok... 0
银河通用王鹤：让具身智能机器人“言出法随”，需攻克两大局限性丨GenAICon 2024

-模型
 +机器人 +动作
 +数据 -模态

05-29 03:00...全球语言大模型、视频大模型、图片大模型、自动驾驶大模型的市场规模都达到至少千亿美元，试问如果能有一个完成任何指令的机器人代替人，它的市场规模会有多大？可能相比于目前车的市场提升两到三个数量级。二、通用机器人面临两大局限性：数据来源有限，机器人反射弧长谷歌的RT-2大模型背后就是通过多模态大模型输出动作，那么这样的大模型... 0
文博会观察：大模型为文化产业发展提供新机遇

-模型
 +文旅 +混元
 +文博会 +文化产业

05-27 18:30...面对内容制作行业多样化需求，腾讯混元在探索基于大模型全面升级的数智人、语音对话虚拟人、具身智能机器人等方面的应用，将更多的前沿技术和应用引入内容生成领域，提升生产效率和交互体验。“多模态大模型正在加速到来，并将重构整个内容产业，而基于多模态的应用也会呈现出百花齐放之势。”刘煜宏说，基于基础能力积累，腾讯混元大模型推进相... 0
中科信息副总经理钟勇：B端大模型落地应用会更快

+钟勇
 -模型 +人工智能
 +中科 +落地

05-26 18:40...目前通用的大语言模型主要应用于C端，针对B端的大语言模型发展水平还有待提升。他认为，相较于通用大模型，垂直行业或领域大模型的成果可能会更快落地。过去的2023年被称为“AI元年”，人工智能、AI大模型概念迅速点燃市场。尤其是OpenAI发布的多模态预训练大模型GPT-4引发了公众对人工智能的极大热情，激发人工智能产业发... 0
让人工智能大模型做K12学科试题，能赶上人类水平吗？

-模型 +评测
 +文生 -模态
 +学科

05-23 20:50...北京市海淀区教师进修学校校长姚守梅解读大模型K12学科测试结果时指出，在语文、历史等人文学科的考试中，模型欠缺对文字背后的文化内涵以及家国情怀的理解。面对历史地理综合题时，模型并不能像人类考生一样有效识别学科属性。相较于简单的英语题，模型反而更擅长复杂的英语题。解理科题目时，模型会出现以超出年级知识范围外的方法解题的情... 0
智源评测体系发布“百模”评估结果

+体系 +结果
 -模型 +评测
 -模态

05-23 16:10...国内头部语言模型的综合表现已接近国际一流水平，但存在能力发展不均衡的情况。在多模态理解图文问答任务上，开闭源模型平分秋色，国产模型表现突出。国产多模态模型在中文语境下的文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上，对比各家公布的演示视频长度和质量，Sora有明显优势，其他开放评测的文生视频模型中，国产模... 0
北大袁粒：用户不会为只能闲聊的大模型买单

-模型 +垂域
 +袁粒 -模态
 +大家

05-21 05:40...其实WPS当前也已经能做这到一步，因为我们从2022年下半年到2023年初发布。当然在这个之后，我们进行了升级，升级成一个多模态的模型，这个视频放一下，这也是我们目前部署给某奢侈品巨头的一个真正落地的case，大家可以看到已经不是单模态，能进行数据的可视化，以及能进行一些营销的处理，包括帮你分析这个产品哪一个明星来代言... 0
前Meta首席工程负责人胡鲁辉：“后GPT

-模型
 +视觉 -模态
 +开源 +物理

05-21 03:00...人工智能在历史上有两个拐点，AlphaGo和ChatGPT。虽然每一个拐点只代表一个产品或者技术，但其对人类的影响不仅是技术本身，如AlphaGo，不可能所有公司都做下棋产品或平台。对社会来说，第一次是利用拐点背后的技术（如CV或别的技术）开始AI1.0时代。这一次则是基于大模型泛化涌现的能力开始AI2.0时代。Cha... 0
又是疯狂的一周，全世界都「AI 麻了」！

-模型
 -模态 +助手
 +字节 +开源

05-19 19:40...「Her」真的来了：「GPT-4o」将语音助手带到了新高度多模态融合模型，只是工程的进步吗？OpenAI发布了新一代旗舰模型GPT-4o，它可以让人们在手机上与ChatGPT对话，就像他们与Siri和其他语音助手对话一样。不同的是，ChatGPT语音助手的理解能力有了质的飞跃，还可以分析和讨论它所看到的图像或视频，并能... 0
Meta首发「变色龙」挑战GPT

-模态
 -模型 +文本
 +训练 +图像

05-19 19:40...甚至还有人称，在GPT-4o诞生之后发布的非常扎实的研究，OOS将迎头赶上。不过，目前Chameleon模型支持生成的模态，主要是图像文本。缺少了GPT-4o中的语音能力。网友称，然后只需添加另一种模态（音频），扩大训练数据集，「烹饪」一段时间，我们就会得到GPT-4o...?Meta的产品管理总监称，「我非常自豪能够... 0
人工智能赋能千行百业多模态大模型引领“智慧未来”

-模型
 +人工智能 -模态
 +智慧 +百业

05-16 15:50...我国共有117个生成式人工智能服务完成备案。据不完全统计，国产大模型数量目前已超过200个，覆盖多个行业领域，多模态大模型的应用场景不断拓展。算力成本是影响人工智能大模型推广应用、智慧赋能的重要因素，大模型产品价格的“居高不下”长期制约着人工智能应用的普惠化发展。近日，火山引擎云服务平台发布了国内首批通过算法备案的“豆... 0
OpenAI推“王炸”新模型聪明又快速还会提供情绪价值

-模型 -模态
 +对话 +文本
 +语音

05-15 23:00...还能解答数学方程式，甚至还能识别图像中的人物微表情。根据传统基准测试，GPT-4o的性能对比GPT-4Turbo（OpenAI去年11月发布的大模型）基本都处于优势，对比其他模型更是大幅领先。具体来说，GPT-4o在英语文本和代码上的性能与GPT-4Turbo类似，但在非英语文本上的性能显著提高，与现有模型相比，GPT... 0
李开复带队发布大模型应用

-模型 +财报
 +李开复 +带队
 +知识库

05-10 23:00...为人们提供最新的数据和见解。长文本处理能力是语言大模型的重要能力。据介绍，万知可以秒读5000页字海，多模态读懂中英图表。在实测过程中，一篇169页的全英文财报，万知小程序可在3秒内对内容重点进行提炼，对于财报中的财务数据进行解读，并且按照财报叙述逻辑总结重点。经过2023年的混战，国内大模型产品都在争夺中国版Chat... 0
从语言大模型到文生视频大模型颠覆性的技术革命正在发生现实不存在了吗？

-模型 +革命
 -模态 +人工智能
 +语言

05-08 18:20...让人仿佛置身于一个由数字编织的新世界。与此同时，人们对大模型的好奇也与日俱增。“现实不存在了？”这是大家在多模态大模型出现后登上热搜的评论。现在热议的新质生产力正是以数字化、网络化、智能化新技术为支撑。而多模态大模型无疑也是大家关注的焦点。多模态大模型到底是什么？多模态大模型有着怎样的前世今生，并将带来什么样的产业变革... 0
“最强开源大模型”登场！扎克伯格最新2万字访谈揭秘Llama 3规划、AI下个前沿战场和开源风险

+开源 +规划
 -模型 +伯格
 +训练

04-28 20:50...”谈及Llama3，扎克伯格称，“我们实际上训练了三个版本，分别是80亿、700亿和4050亿的密集模型，其中4050亿的模型仍在训练中。然而，对于80亿和700亿的模型，我对其结果感到非常兴奋。它们在规模方面处于领先地位。”据他介绍，这些新版本将为现有版本带来多模态性、更多语言性和更大的上下文窗口。Meta希望今年晚... 1
首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

-模型
 +语言 +视觉
 -模态 +开源

04-23 00:40...即在保持基于注意力的Transformer结构不变的情况下减少基础语言模型的参数或视觉token的数量。本文提出了一个不同的视角：直接采用状态空间模型（SSM）作为骨干网络，得到了一种线性计算复杂度的MLLM。此外，本文还探索和研究了各种模态融合方案，以创建一个有效的多模态Mamba。具体来说，本文采用Mamba语言模... 0
如何跨越大模型落地应用“最后一公里”

-模型
 +人工智能 +落地
 -模态 +周明

04-21 21:10...并且数量持续增长；通过备案的大模型36个，占北京市的72%以上；已初步围绕中关村、知春路、学院路等，在全国率先形成了人工智能大模型产业集聚区。澜舟科技便是海淀区具有代表性的人工智能大模型企业。“我认为，人工智能大模型在中国最大的应用前景是为企业提供服务。”澜舟科技创始人兼CEO周明表示，在数字化浪潮中，以大模型为代表的... 3
李彦宏：自然语言将成为新的通用编程语言

+李彦宏 -模型
 +编程语言 +智能
 +文心

04-17 13:30...0工具版正式发布。李彦宏介绍，文心一言发布一年多以来，用户数已经突破2亿。“相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。”他说。会上，李彦宏分享了百度基于大模型开发AI原生应用的具体思路，指出MoE、小模型和智能体是值得关... 0
如何跨越大模型落地应用“最后一公里”

+党政
 +座谈会 +代表团
 +北京 -模型

04-12 20:30...通过备案的大模型36个，占北京市的72%以上；已初步围绕中关村、知春路、学院路等，在全国率先形成了人工智能大模型产业集聚区。澜舟科技便是海淀区具有代表性的人工智能大模型企业。“我认为，人工智能大模型在中国最大的应用前景是为企业提供服务。”澜舟科技创始人兼CEO周明表示，在数字化浪潮中，以大模型为代表的人工智能正在重塑人... 1
腾讯刘煜宏：多模态大模型将重塑内容产业

-模型
 +混元 -模态
 +场景 +重塑

04-09 00:50...腾讯混元大模型技术架构已升级为混合专家模型(MoE)架构，参数规模达万亿，尤以处理复杂场景和多任务场景见长。目前腾讯混元所提供的不同尺寸模型，可适应更多低成本和高推理性能的应用场景。刘煜宏介绍，腾讯混元正积极发展多模态模型，以进一步加强文生图、文生3D以及文/图生视频能力。据悉，基于基础能力积累，腾讯混元大模型正推进相... 0
上海创新成果不断涌现

-模型
 +算力 +上海
 +人工智能 +成果

04-06 04:10...服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家；上海市具备大规模应用赋能价值的智算中心数量达到10家。“人工智能是上海重点发展的先导产业，长期以来上海集聚资源，加快打造世界级的产业集群。”上海市副市长陈杰在日前举办的2024全球开发者先锋大会上介绍，上海大模型创新成果不断涌现。上海人工智能实验室开发的“... 0
上海创新成果不断涌现推动大模型产业提质发展

-模型
 +算力 +上海
 +提质 +人工智能

04-04 13:00...上海市通信管理局等11个部门联合印发的《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案（2024—2025年）》提出，到2025年，新建智算中心国产算力芯片使用占比超过50%，国产存储使用占比超过50%，服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家；上海市具备大规模应用赋能价值的智算中心... 0

« 1 2 3 4 5 »