DeepSeek被超越，AI竞赛进入新局面,计算资源

DeepSeek被超越，AI竞赛进入新局面

-计算资源 +模型
 +美国 +技术
 +竞赛

03-12 05:00...虽然对成本的估算存在分歧，但是，将图形处理器（GPU）利用到极限、借助AI在反复探索的同时提高性能的“强化学习”来提升性能的方法等具有划时代意义。很多研究人员和技术人员给予高度评价。利用现有的生成式AI输出的数据来创造新模型的“蒸馏”方法也带来了高效率的开发。到目前为止，学习数据和计算资源越多，生成式AI的性能越高。显... 0
DeepSeek能否开启全民AI时代

+模型 +开源
 +全民 +架构
 +开发者

03-03 00:00...也带来了商业推广难题：大模型投不起，小模型不好用。DeepSeek改变了这一格局。他们在模型架构和训练过程中进行深度优化，在大幅降低计算资源消耗的同时，跻身世界顶级AI大模型之列，实现了“低成本”与“高性能”的兼得。同时，与OpenAI的闭源策略相反，DeepSeek免费开源其大模型，明示全部技术路线，更加推动了大模型... 0
DeepSeek被超越，AI竞赛进入新局面

-计算资源 +模型
 +美国 +技术
 +竞赛

02-28 05:40...R1被认为以低成本开发出与美国OpenAI于2024年12月正式发布的“o1”相匹敌的性能。虽然对成本的估算存在分歧，但是，将图形处理器（GPU）利用到极限、借助AI在反复探索的同时提高性能的“强化学习”来提升性能的方法等具有划时代意义。很多研究人员和技术人员给予高度评价。利用现有的生成式AI输出的数据来创造新模型的“... 0
黄仁勋首次回应DeepSeek冲击波

+黄仁勋 +模型
 +开源 +冲击波
 +训练

02-24 02:50...R1的发布本质上利好AI市场，能够加速AI被采用，也就意味着市场仍然需要计算资源：“这让每个人都注意到，模型的效率远超我们的想象。因此，它正在不断扩大，并加速AI的普及。”黄仁勋还指出，虽然DeepSeek在AI模型的预训练方面取得了进步，但作为模型“学习解决问题”的关键环节，后训练（post-training）仍然很... 0
DeepSeek能否开启全民AI时代

+模型
 +开源 +全民
 +架构 +开发者

02-16 04:20...与OpenAI的闭源策略相反，DeepSeek免费开源其大模型，明示全部技术路线，更加推动了大模型技术从“奢侈品”向“日用品”的转变。从技术进步角度看，低成本开源大模型开启竞争新赛道，AI的未来更值得期待。低成本是技术普及的基本要求，买得起才能让千家万户用得上。小汽车、个人电脑、手机的普及都是如此，人工智能产业大概也不... 0
DeepSeek能否开启全民AI时代

+模型 +开源
 +全民 +架构
 +开发者

02-16 02:30...跻身世界顶级AI大模型之列，实现了低成本与高性能的兼得。同时，与OpenAI的闭源策略相反，DeepSeek免费开源其大模型，明示全部技术路线，更加推动了大模型技术从奢侈品向日用品的转变。从技术进步角度看，低成本开源大模型开启竞争新赛道，AI的未来更值得期待。低成本是技术普及的基本要求，买得起才能让千家万户用得上。小汽... 0
Anthropic新模型发布在即！“滑动比例”助企业降本增效，编程能力超o3

+模型 +滑动
 +编程 +开发者
 +降本增效

02-15 15:10...模型又能够像传统大语言模型一样快速处理，无需额外计算。最重要的是，它提供一种新颖的“滑动比例”功能，开发者可以通过滑动条精准控制模型在处理查询时使用的计算资源量，从而调整推理深度和模型的“思考”时间。例如，将滑动条设置为“0”时，模型将作为普通的非推理AI运行，类似于OpenAI的GPT-4o。这为开发者提高了成本效益... 1
开学在即，这4条“收心”建议转给师生家长

+模型
 -计算资源 +算力
 +高性能 +孩子

02-13 18:20...家长就可以让孩子一点一点地恢复上学期间的作息时间了。如果缺少这个循序渐进的过程，那么开学之初，孩子的精神很容易不集中，甚至会出现困倦、散漫等现象。除了要早睡早起，孩子一天的活动也要尽量向在校上课时的安排靠拢。比如，上午8-11点是学校的上课时间，就不要让孩子过分沉迷于游戏娱乐，最好静下心来读读书。时间一长，孩子的“玩心... 2
国家超算西安中心参与DeepSeek系列模型适配工作为国产AI大模型提供高性能计算资源和算力支持

 +人民代表大会常务委员会 +海南
 +人事 +规定
 +模型

02-13 18:10...国家超算西安中心正在与国家超算互联网平台一同开展DeepSeek系列模型适配工作，携手打造国产AI大模型创新算力底座春节期间，国产AI大模型——DeepSeek火遍全网。2月10日，记者从国家超算西安中心获悉：国家超算互联网平台日前已上线DeepSeek系列模型。作为超算互联网联合体首批成员单位之一，国家超算西安中心正... 2
DeepSeek算法和成本遇争议全面分析报告揭示真相

+成本 +争议
 +算法 +模型
 +分析

02-08 20:20...深入探讨了DeepSeek的技术优势、成本估算以及市场表现。报告指出，DeepSeek通过一种名为MLA（多头潜在注意力）的创新模式大幅降低了训练成本，并在模型性能上取得了显著进步。此外，报告还讨论了R1和o1等模型之间的对比，揭示了DeepSeek在技术上的独特之处。据估计，DeepSeek拥有约5万块HopperG... 1
成本不到150元！李飞飞等26分钟训出推理模型媲美R1，秘诀：蒸馏

+团队 +模型
 +训练 +李飞飞
 +秘诀

02-07 11:20...s1团队的目标是寻找到Test-timeScaling的简单方法。过程中，研究人员先构建了一个1000个样本的数据集，名为s1K。起初，在遵循质量、难度、多样性原则的基础上，这个数据集收集了来自MATH、AGIEval等诸多来源的59029个问题。经去重、去噪后，通过质量筛选、基于模型性能和推理痕迹长度的难度筛选，以及... 0
OpenAI大地震一分为二，全力冲刺AGI！一半向钱看，一半装理想

+非营利 +营利性
 +架构 +奥特曼
 -计算资源

12-29 22:10...「我们再次需要筹集比想象中更多的资金。投资者希望支持我们，但在这种资本规模下，他们需要传统的股权和较少的结构性定制。」还能这么玩？马斯克被KO了。AGI跟利润挂钩，遭强烈反对昨天，OpenAI被曝料在与微软的交易中，将AGI定义为「在最具经济价值的任务上超越人类的AI」，还设定了至少1000亿美元投资者回报的利润目标。... 9
OpenAI官方爆料，长文开怼马斯克：靠打官司实现不了AGI！

+马斯克
 +非营利 +营利性
 +特斯拉 +控制权

12-16 02:20...OpenAI已成为世界领先的AI研究实验室，而马斯克不仅经营着一家与我们竞争AI公司，甚至还请求法院阻止我们顺利地实现我们的使命。但光靠打官司是无法实现AGI的。我们深深敬佩马斯克的成就，也感激他早期对OpenAI的贡献，但他应该在市场上而非法庭上与我们竞争。目前，维持美国在全球AI领域的领导地位至关重要。我们的使命是... 0
OpenAI官方爆料，长文开怼马斯克：靠打官司实现不了AGI！

+马斯克
 +非营利 +营利性
 +特斯拉 +控制权

12-16 02:10...而马斯克不仅经营着一家与我们竞争AI公司，甚至还请求法院阻止我们顺利地实现我们的使命。但光靠打官司是无法实现AGI的。我们深深敬佩马斯克的成就，也感激他早期对OpenAI的贡献，但他应该在市场上而非法庭上与我们竞争。目前，维持美国在全球AI领域的领导地位至关重要。我们的使命是让AGI造福全人类，我们始终是、也将永远是一... 4
桑达尔・皮查伊：到 2025 年，谷歌搜索将“发生深刻变化”

+皮查伊
 +谷歌 +搜索引擎
 +模型 +人工智能

12-08 21:40...并认为人们将能够解决“比以往更复杂”的问题。“我认为即使在2025年初，搜索引擎能够做的事情也会让你感到惊讶，相比今天的功能，它将有很大的提升。”皮查伊还回应了微软CEO萨蒂亚・纳德拉（SatyaNadella）今年早些时候的言论，后者曾表示，谷歌应该是人工智能竞赛中的“默认赢家”。皮查伊表示：“我很愿意将微软自己的模... 2
我国绿色智能计算产业“井喷”发展

 +算力
 +智能 +绿色
 +智算 +井喷

10-02 20:00...大会开幕式上还发布了《绿色智能计算长沙倡议》，提出加快建设绿色数据中心、智算中心，构建灵活高效的算力互联网。2024世界计算大会开幕式现场。新华社记者陈振海摄与会专家介绍，生成式人工智能、大模型等新技术的出现，对智能算力的需求越来越大。中兴通讯股份有限公司董事长李自学说，在“数智”时代，算力成为新的生产力引擎，但也面临... 0
云科技为动画电影“加速” 渲染周期可压缩四成

+动画电影
 +白蛇 +电影
 +动画 +制作

08-22 18:10...近年来，国产动画电影《白蛇：缘起》《新神榜：哪吒重生》《白蛇2：青蛇劫起》《新神榜：杨戬》《长安三万里》等以高水准的视效体验，叫好又叫座。其背后则是卷帙浩繁的后期工作量和时长。以《白蛇：浮生》为例，其电影总渲染时长达到了2.52亿核小时，其中灯光渲染量2.01亿核小时，占电影总渲染量80%。传统模式中影视制作公司一般自... 2
湖南省气象监测预警信息化工程项目（无缝隙气象灾害监测预警评估能力建设

+预警
 +气象 +监测
 +能力 +供应商

08-09 14:50...结果公告如下：一、采购项目名称、编号采购项目名称：湖南省气象监测预警信息化工程项目（无缝隙气象灾害监测预警评估能力建设-高性能计算资源）政府采购计划编号：湘财采计[2024]002022号代理机构名称：湖南乐航工程项目管理有限公司采购项目编号：1094005-20240711-18预算金额：27,487,200.00元... 4
Meta发布最强开源AI模型，对标GPT4

+模型 +伯格
 +开源 +文本
 +机器人

07-24 03:10...然后生成他们在不同场景和情境中的描绘。像其他开源和闭源生成式AI模型一样，Llama3.1405B可以执行各种任务，可以编程、回答基本数学问题，也可以用八种语言（英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语）总结文件。该模型目前仅支持文本操作，这意味着它不能回答图像问题，但大多数基于文本的工作负载（如分... 0
用AI重新定义通信，超算互联网时代的调度与调优

 +调度
 +训练 +内存
 -计算资源 +算力

11-29 23:30...若能将长尾消费级显卡利用在如推理测等要求较低的场景，也能缓解部分算力需求。2.1.5跨区域、跨集群、跨架构的算力调度调优能力日益重要在大规模训练上，和传统云计算比较，需要考虑的问题更加复杂。首先，面对单卡无法装载的大模型，如何利用多卡来突破内存限制的瓶颈是个问题。其次，大规模训练会用到大量的计算资源，大量计算资源间如何... 1
迄今最短快速射电暴仅持续5微秒

+射电
 +持续时间 +研究
 +荷兰 -计算资源

08-12 09:00...通常情况下，FRB会持续几毫秒（千分之一秒），但2022年，荷兰射电天文研究所研究团队发现了持续时间更短的FRB。在最新研究中，来自荷兰和美国的科学家研究了绿岸望远镜对FRB20121102A的观测结果，发现了19次新的暴发，其中8次持续时间极短——介于5到15微秒之间。目前尚不清楚这一发现是否支持FRB的特定模型，如... 5
之江实验室成功进入AI

+算力
 +之江 +任务
 +实验室 +智能

07-31 07:20...公共算力平台是具备人工智能计算能力并提供算力服务的基础设施，是建设智能社会、发展智能经济的基本要素，以及理论创新、科技发展、产业带动、人才汇聚和生态构建的重要载体。之江实验室智能计算软件研究中心主任潘爱民表示：“一个规模较大的数据中心每天要面临大量复杂的计算需求，这就需要根据不同的任务所需，以最佳方式利用既有计算资源和... 6

« 1 2 »