-
06-18 20:30...这条被多方验证的路径还在推进中,还远没有触达天花板。同时,大模型的智慧来自于接近无损的压缩,这点也非常重要。因为规模定律过程中不能盲目堆更多的GPU,所以需要有一个方法评估大模型企业有没有越做越好或者哪个方法做得更好。遵循规模定律也成为当前诸多大模型企业规模化应用大模型时尝试突破算力限制,将计算效率最优化的有效途径之一... 6
-
05-15 04:20...这是我们未来努力的目标。”此前,据界面新闻记者从多个渠道获悉,上一轮融资完成后,大模型初创企业月之暗面的创始人杨植麟通过售出个人持股已套现数千万美金。对于该传言,月之暗面4月23日回应澎湃新闻称,“上述消息不实,月之暗面此前已公布员工激励计划。”但至于该激励计划与此次“套现”传言之间有何关系,月之暗面未给予进一步解释。... 0
-
05-15 04:20...在更全面的综合评测中,Yi-Large有多数指标超越了GPT4、Claude3、GoogleGemini1.5等同级模型,在通用能力、代码生成、数学推理、指令遵循等方面都位居领先,稳列全球第一梯队。李开复表示,一系列权威测评表明,Yi-Large是当前可用的最好的AI大模型,不过零一万物仍在继续创新,正在训练规模更大的... 1
-
05-14 21:00...中国在人工智能上取得的优势包括:比如FACE++最近打败了脸书、谷歌,在coco比赛里面得到了第一;此外,中国的数据比较多,移动互联网的人数多,移动支付是美国的50倍,共享单车是美国的300倍。数据量大,对人工智能来说就有更多的燃料。另外,中国人工智能创业者和资本结合得特别好。资本很愿意去投资具备人工智能潜力的公司,而... 0
-
05-13 16:50...指令遵循(InstructionFollowing)相关评测也越发受到全球大模型企业重视。斯坦福开源评测项目AlpacaEval和伯克利LM-SYS推出的MT-bench是两组英文指令遵循评测集,AlignBench则是由清华大学的团队推出的中文对齐评测基准。在中外权威指令遵循评测集中,Yi-Large的表现均优于国际... 0
-
05-13 16:40...形成了开源闭源双轨完善生态。问:您对国产推理芯片的发展怎么看?零一万物是否会选用国产的推理芯片?李开复:我觉得国产的训练芯片和推理芯片我们都要全力支持,但是两个的差别是比较大的。训练芯片还是有一定的难度,包括CUDA的需求。推理芯片几个好处,一是本身比较简单,二是对CUDA没有那么强的依赖性,还有它不见得需要那么难的制... 2
-
-
05-13 12:30...Yi-Large模型的英语能力主要指标LCWinRate(控制回复的长度)排到了世界第二,仅次于GPT-4Turbo,WinRate世界第一,此前国内模型中仅有Yi和Qwen曾经登上此榜单的前20。斯坦福AlpacaEval2.0Verified认证模型类别,英语能力评测(2024年5月12日)在中文能力方面,Supe... 3
-
05-10 23:00...为人们提供最新的数据和见解。长文本处理能力是语言大模型的重要能力。据介绍,万知可以秒读5000页字海,多模态读懂中英图表。在实测过程中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对于财报中的财务数据进行解读,并且按照财报叙述逻辑总结重点。经过2023年的混战,国内大模型产品都在争夺中国版Chat... 1
-
04-30 04:30...类比过去的几个重要节点,李开复说,PC时代“给每个办公桌上放了一台电脑”;移动互联网时代让我们随身携带一个可以“连接信息、连接人,且知道我在什么地方”的移动设备;AI时代则相当于把一个智商(IQ)300的天才放到每个人身边,帮人思考、回答问题、解决难题,这一定会带来更高的生产力提升。回顾大模型的发展,李开复说,刚开始时... 0
-
03-07 06:30...默认上下文长度为4Ktokens。该模型是在Yi-6B(使用了3.1Ttokens训练)的基础上,使用了0.8Ttokens进行继续训练,数据截至2023年6月。据介绍,在综合能力方面(Mean-All),Yi-9B的性能“在尺寸相近的开源模型中最好”,超越了DeepSeek-Coder、DeepSeek-Math、M... 1
-
01-16 13:20...所以,如何把上下文窗口做得更大,成为各家公司比拼的战场。而Yi-34B的突破,相当于能一次处理两本《三体》小说、理解超过1000页的PDF文档等场景,将成为首家将超长上下文窗口在开源社区开放的大模型公司。另一个突破则在于训练成本大幅降低。零一万物给出一组数据:Yi-34B模型训练成本实测下降40%,实际训练完成达标时间... 0
-
12-28 15:00...这种情况在中国早已屡见不鲜。例如团购风潮、共享单车应用的兴起,甚至在深度科技领域,比如计算机视觉和语音识别技术。当计算机视觉证明其价值时,无数中国企业争先恐后地涌入,试图在各种可能的应用中分一杯羹。然而,大多数企业并未能幸存下来。如今,中国的人工智能领域仍处于预选赛阶段,竞争异常激烈,甚至可能超过美国。首先,我们需要面... 1
-
-
11-30 09:20...这个不管对于开源还是对商业闭源都是同等的重要。冯大刚:刚才两位老师提到了开源、闭源之争,都是非常好的话题。下面我们聊一下,两位的AI道路是怎么开启的?我听说在几年以前,或者十年以前,如果跟别人说我的梦想是AGI,可能要遭到嘲笑。你们觉得AGI真的可以实现吗?中国现在是发展AGI好的时机吗?张亚勤:我做AI有20年了,是... 0
-
11-30 07:50...甚至改变传统行业的2.0时代。36氪CEO冯大刚,创新工场董事长、零一万物CEO李开复博士,中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤聚焦“AI的时代重构”,36氪CEO冯大刚与创新工场董事长、零一万物CEO李开复博士,中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤展开深度对话,探索中国科技... 0
-
11-22 06:40...的开源代码,对外却没有提及。套壳却不说明的做法引来了大量质疑。对此,该公司致歉称:正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中。该公司负责人表示公司不存在抄袭问题。今天就来跟大家聊聊,法律上,这种行为算不算抄袭?法律后果还有哪些?先说结论。我国《著作权法》规定:署名权,即表明作者身份,在作品上署名的... 0
-
11-15 23:40...取决于具体的实现细节和底层技术。“如果零一万物大模型使用了与MetaLLaMA相同的模型架构、训练方法和数据集,那么它可能在某种程度上是套壳的。但是,如果它使用了不同的技术或进行了额外的改进,那么就不能简单地说是套壳。”根据零一万物的声明,其投注了大部分精力调整训练方法、数据配比、数据工程、细节参数、babysitti... 0
-
11-07 06:00...比如零一万物技术副总裁及Pretrain负责人黄文灏曾先后任职于微软亚洲研究院和智源研究院,非常早就介入了AI2.0工作。零一万物技术副总裁及AIInfra负责人戴宗宏此前曾担任过华为云AICTO及技术创新部长、阿里达摩院AIInfra总监。他管理的Infra团队核心成员主要来自于阿里、华为、微软、商汤,这些人曾经参与... 1
-
11-07 04:50...李开复认为开源模型的发布就是一个验证开源社区与开源方法论的尝试。HuggingFace作为AI领域的Github,提供大量开源模型与工具。根据HuggingFace英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型取得多项SOTA国际最佳性能指标认可。此次零一万物开源发布的Yi系列模型,包含34B... 0
-
-
11-07 03:50...超过了LLaMA-70B和Falcon-180B。值得注意的是,Yi-34B的参数量要远远小于LLaMA-70B和Falcon-180B,却实现了以百亿级参数量超越千亿级参数量的“壮举”。除此以外,Yi系列大模型的其他亮点包括支持中英双语,在中文能力方面领先于所有的开源大模型,而且拥有超长的上下文窗口,可以生成更为丰富... 0
-
07-04 04:50...零一万物正搭建一个实验平台,构建GPU集群进行训练、调优和推理,提高数据有效参数量,以及高质量数据的密度,以构建训练能力。着眼当下,大模型自研需要从细微处探讨技术路径。零一万物将大模型平台研发拆解为七大模块技术路线图,包含预训练框架(Pre-train)技术、Post-train技术、AIInfra技术、多模态模型技术... 1
-
07-03 18:50...另一方面得益于创新工场擅长的科技投资+全面赋能的“塔尖孵化”模式,能够帮助科技公司从零到一再到万,打造世界级的创新。此前,创新工场已经“塔尖孵化”六家AI公司,并有一家公司成功上市。零一万物致力于成为一家由技术愿景驱动、拥有卓越中国工程底蕴的创新企业,推动以基座大模型为突破的AI2.0掀起技术、平台到应用多个层面的革命... 1
-
03-25 17:10...机器开始在计算机视觉、自然语言理解技术等领域超越人类,并创造了显著的价值。“但是AI1.0也遇到了瓶颈,大多数行业想利用AI,需要花费巨大的成本来收集和标注数据,而这些数据集和诸多模型各成“孤岛”缺乏纵效。”李开复进一步解释说,这是为什么大部分的AI1.0企业投入大笔研发经费但仍然长年亏损。除此之外,AI1.0缺少像互... 1
-
-
-
本页Url:
-
2024-06-26-02:49 GMT . 添加到桌面浏览更方便.
-
![noimg](http://testingcf.jsdelivr.net/gh/wadelau/ufqi/news/view/default/images/unkown-img.png)