-
06-17 15:30...据介绍,针对大模型训练算力消耗高的问题,智源研究院和人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型Tele-FLM-1T。该模型与百亿级的52B版本,千亿级的102B版本共同构成Tele-FLM系列模型。针对大模型幻觉等问题,智源研究院自主研发了通用语义向... 6
-
06-16 23:10...它能不能够直接到达,我觉得现在还有很多未知的因素,包括刚才提到的AGI定义是什么。但我想提一个可能大家没有提到的点,我觉得现在的大模型作为知识压缩主要是在处理人的大脑的系统1的工作。我认为这种慢思考的系统2的去做各种各样的推理,搜索空间里面去做搜索、组合,来完成任务这样的能力,我觉得是未来大模型可能要通过agent的技... 1
-
-
-
本页Url:
-
2024-06-30-23:06 GMT . 添加到桌面浏览更方便.
-
![noimg](http://testingcf.jsdelivr.net/gh/wadelau/ufqi/news/view/default/images/unkown-img.png)