零一万物发布千亿参数模型Yi,开发者,闭源

零一万物发布千亿参数模型Yi

+模型
 +万物 -闭源
 +开源 +评测

05-13 12:30...Yi-Large模型的英语能力主要指标LCWinRate（控制回复的长度）排到了世界第二，仅次于GPT-4Turbo，WinRate世界第一，此前国内模型中仅有Yi和Qwen曾经登上此榜单的前20。斯坦福AlpacaEval2.0Verified认证模型类别，英语能力评测（2024年5月12日）在中文能力方面，Supe... 0
Meta继续押宝开源大模型 Llama 3拿下“赛点”？

+开源
 -闭源 +模型
 +赛点 -开发者

04-22 22:10...在8192个token的序列上训练模型，使用掩码来确保自注意力（Self-Attention）不会跨越文档边界。据Meta介绍，Llama3已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型。此外，Llama3发布后，微软Azure、谷歌云、百度智能云等陆续宣... 0
Llama 3拿下“赛点”？大模型角力场，开源与闭源之争仍在继续｜大模界

+开源 -闭源
 +模型 +赛点
 +模界

04-22 04:20...是目前市场上最好的开源大模型。此外，Llama3发布后，微软Azure、谷歌云、百度智能云等陆续宣布其平台上线Llama3。百度方面此前对《每日经济新闻》记者表示，百度智能云千帆大模型平台在国内首家推出针对Llama3全系列版本的训练推理方案，便于开发者进行再训练，搭建专属大模型。工业和信息化部工业文化发展中心AI应用... 0
马斯克为何要作开源“秀”

+开源
 +马斯克 +模型
 -开发者 +访问量

03-22 23:50...对于云服务用户来说，至少需要8张80GB显存的A100或H100GPU。在Grok的GitHub讨论区有用户留言表示：谷歌云上80GBA100的4卡服务器每小时运行成本是20美元，这不适合我。（GCPinstancewith4A10080GB;itcostaround$20perhour;thisisnotformeL... 1
开放Gemma而非“开源”，谷歌为何转变大模型竞争策略？

+竞争
 +模型 +谷歌
 +开源 +参数

02-22 10:20...仅有20亿参数和70亿参数两个规模版本，且两种参数规模的Gemma模型都会有预训练和指令微调版本。较小的参数规模有助于Gemma实现更广泛部署。谷歌介绍称，Gemma支持主流AI框架，还可在笔记本电脑、台式机、物联网、移动设备和云端等环境上运行。该公司公布的测评结果显示，Gemma在数学、编码、推理精通性和知识测试等许... 1
阿里云的开源算盘

+开源
 +模型 +通义
 -开发者 +参数

12-06 21:20...能更好地被下游应用集成。比如，Qwen-72B搭载了强大的系统指令能力，用户只用一句提示词就可定制AI助手，要求大模型扮演某个角色或者执行特定的回复任务。通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。截至目前，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及... 0
红帽“闭源”疑云始末：CentOS Stream正在重塑开源新生态

+小鹏 +滴滴
 +深度 +规模
 +红帽

08-31 00:10...还是会首先在CentOSStream里公开。之前用于托管CentOS项目的源代码和软件包的服务器——git.centos.org，将不再使用，取而代之的是CentOS的官方网站centos这是CentOS项目转向CentOSStream的一部分，包含了CentOSLinux和CentOSStream的各种版本和架构的R... 16
开源大模型有望迎接“安卓时刻”，创业公司如何抓住机遇？

+开源 +模型
 +生态 -闭源
 +算法

08-28 22:40...”HuggingFace作为AI开源社区界的“顶流”，目前社区已有超过26万个开源模型以及4.6万个开源数据库，并抱有这样一种信念——“未来每家公司都将拥有自己的模型、自己的机器学习能力”。HuggingFace亚太区首席机器学习工程师尹一峰，基于对社区的一手观察分享了对开源生态趋势的展望。“我们对开源生态有四点观察：... 1

« 1 »