-
2023-12-14...中国人工智能AI的北京模式:这里的黎明静悄悄-2
2
2020年,OpenAI发布了GPT-3,引来了智源院的关注。
大家在雁栖湖开了一场会,一致认定要开展中国自己的大模型研究。从雁栖湖回来后,他们发布了一个英雄帖,招揽各领域有兴趣的专家。
项目组很快就得到了响应。从清华、... 134 -
2023-12-14...[編按: 轉載于 新浪網/財經頭條/獸樓処, 2023-12-14. 这里的黎明静悄悄 ]
中国人工智能AI的北京模式:这里的黎明静悄悄
(2022年12月)半年前,大洋彼岸发布了GPT-4大模型。美國OpenAI的工作人员介绍说,相比起过往发布的模型,这款新的大... 150 -
2023-02-10...[编按: 转载于 网易网/蒲公英互联, 2023-02-10. ]
ChatGPT 编年史
我们如何错过GPT盛宴
GPT大语言模型能实现AGI吗?
----
ChatGPT编年史----
我们来梳理一个时间轴。ChatGPT是对话式UI + GPT–... 164 -
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-10
未来之路:LLM研究趋势及值得研究的重点方向
这里列出一些我个人认为比较重要的LLM研究领域,或值得深入探索的研究方向。
探索LLM模型的规模天花板
尽管继续推大LLM模型的规模,这事看似没有技术含量,但是其实这个事... 100 -
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-8
智慧之光:如何增强LLM的推理能力
目前很多研究已证明LLM对于知识具有强大的记忆能力,但是,一般我们不会因为一个人记忆能力强,就说这人很聪明,是否具有强大的推理能力,往往是我们判断一个人是否聪明的重要标准。类似的,如果LLM的效果想... 125 🈶🖼️ -
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-7
人机接口:从In Context Learning到Instruct理解
一般我们经常提到的人和LLM的接口技术包括:zero shot prompting、few shot prompting、In Context Learning,以及In... 95 -
-
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-6
规模效应:当LLM越来越大时会发生什么
我们知道,近年来,LLM模型规模在快速增长,目前效果最好的LLM模型,其参数规模大都超过了千亿(100B)参数规模。比如,OpenAI的GPT 3的规模为175B,Google的LaMDA规模为... 120 -
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-4 影响一:让LLM适配人的新型交互接口
在理想LLM的背景下,我们再来看(美国OpenAI公司的)ChatGPT,能更好理解它的技术贡献。ChatGPT应该是目前所有的现有技术里,最接近理想LLM的技术方法。如果归纳下ChatGPT最突出特点的话,我会用... 160 🈶🖼️ -
2023-02-08...迈向通用人工智能AGI之路:大型语言模型LLM技术精要-2
潮流之巅:NLP研究范式的转换
如果我们把时间线往前拉得更长一些,回到NLP领域的深度学习时代,在更长时间窗口内观察技术变迁及其影响,可能会更容易看清其中的一些关键节点。我个人认为,在最近10年来NLP领域的技术发展过程中,可能存在两次大的研究... 136 -
2021-08-01...(接续)
AlphaFold给我们什么启示?
2020年人工智能领域另一个引人关注的成果是将机器学习应用于基础研究。蛋白质结构预测是生命科学领域的重大科学问题,目前已知氨基酸顺序的蛋白质分子有1.8亿个,但其三维结构信息被彻底看清的还不到0.1%。谷歌旗下的DeepMind公司开发的人工智能程... 130 -
2020-07-02...14.视觉计算与蝇视觉相比,人类视觉要复杂得多。果蝇全部神经元约25万个,人类初级视皮层神经元就有2.8亿个,两者差距上万倍,更遑论结构复杂性。但是,视觉的难度在人工智能早期被严重低估。1967年,明斯基宣称,“创建‘人工智能’只需要一代人”。他的同事佩帕特则表示,“计算机联上摄像头,‘描绘它看到什么’这个问题一个暑期... 173
-
2020-07-02...5. 神经网络皮茨和麦卡洛克是神经网络模型的提出者,威廉•沃尔特(William Grey Walter, 1910-1977)则是神经网络实践的先驱,他们都对控制论的创立产生了重要影响。沃尔特是一位神经生理学家,对神经连接何以产生复杂行为十分感兴趣,开发了第一台脑电图仪。与基于计算发展智能不同,沃尔特坚持用纯模拟电路... 169
-
-
2019-10-11...5 循环神经网络循环神经网络也被称为时间递归神经网络(Recurrent neural network)在前面讨论的卷积神经网络,无法利用历史数据的时间依赖关系,来分析数据特征,对于二维图像来讲,我们已经知道局部感受视野这种空间信息是识别问题的核心,在另外一些与时间相关的问题中,输入的数据是基于时间的序列,卷积网络就无... 220
-
2019-10-11...3.2 受限玻尔兹曼机所谓“受限玻尔兹曼机”(RBM)就是对“玻尔兹曼机”(BM)进行简化,使玻尔兹曼机更容易更加简单使用,原本玻尔兹曼机的可见元和隐元之间是全连接的,而且隐元和隐元之间也是全连接的,这样就增加了计算量和计算难度。“受限玻尔兹曼机”(RBM)同样具有一个可见层,一个隐层,但层内无连接,层与层之间全连接,... 226
-
-
本页Url:
-
2024-03-28-19:04 GMT . 添加到桌面浏览更方便.
-