... 2025-01-17 13:00 .. o1等模型的推出,为大语言模型开辟了新的扩展方向,扩展定律在另外一条路上继续前进。
与此同时,从Sora、可灵、Vidu到GPT-4o,多模态生成模型和理解模型在2024年也取得快速进步,正在打开机器认知和理解世界的全新通道,为后续具身智能和AGI发展奠定基础。
基础模型越来越大,同时也在变得更小,2024年出现了很多只有几十亿参数的小模型,在某些方向上性能可以达到以往千亿甚至万亿参数的水平,小模型能力聚焦,有望大大降低算力和应用成本,加速私有部署和边缘与端侧AI的普及。
算力与数据要素结构性变革魏凯认为,基座大模型演进的新趋势,也会引发算力和数据两大要素的结构性变化。
在算力方面,虽然现在万卡集群建设如火如荼,但随着预训练主体的逐步收敛,考虑到高昂的建设运营成本,未来全球估计只有少数公司真正需要超大规模训练集群,超大规模训练需求有可能很快达到顶峰,增速逐渐放缓。
与 .. UfqiNews ↓
1
本页Url
🤖 智能推荐