假设,训练,迈向通用人工智能AGI之路：大型语言模型LLM技术精要-9

🕙最新发 🔥最热门 ❤️最多评

迈向通用人工智能AGI之路：大型语言模型LLM技术精要-9

+模型 +文本
 -训练 +流程图
 +代码 +能力
 +步骤

2023-02-08...迈向通用人工智能AGI之路：大型语言模型LLM技术精要-9

代码预训练增强LLM推理能力
以上是目前利用Prompt激发LLM模型推理能力的三种主流做法，而关于LLM的推理能力，目前还观察到一个有趣且费解的现象：除了文本外，如果能够加入程序代码一起参与模型预训练，则能大幅提升LLM模型的推理能... 95
迈向通用人工智能AGI之路：大型语言模型LLM技术精要-5

+模型 -训练
 +修正 +数据
 +语言 +单词
 +语义

2023-02-08...迈向通用人工智能AGI之路：大型语言模型LLM技术精要-5

学习者：从无尽数据到海量知识
从目前研究结果看，Transformer是足够强大的特征抽取器，尚不需要做特别的改进。那么通过预训练过程，Transformer学到了什么？知识是如何存取的？我们又如何修正错误知识？本节讲述这方面的研究进... 130
理解计算：从根号2到AlphaGo -20: 第8季深度学习发展简史

+神经网络
 +网络 +参数
 +模型 +能量
 +状态 +概率

2019-10-11...1 引子在本系列的2，3，4季中，我们分别介绍了神经网络的生物学背景，最早的关于神经元的数学模型，以及具有学习功能的感知机。我们现在已经知道，如何学习神经网络的参数是最为关键的问题，这个问题从宏观上看实际上跟求解2的平方根并没有本质不同，即需要一个迭代过程(梯度下降)不断更新模型的参数。在一个著名的Adaline模型(... 218
理解计算：从根号2到AlphaGo -15: 第6季多维的浪漫：统计学习理论与支持向量机-3

+分类器 +样本
 +向量 +空间
 +分类 +模型
 +线性

2019-10-11...VC 维由此可见，随着数据n的增长，对数据分类的能力反映了模型的性能。在之前，我们用Shattering Coefficient 即N(F,n)度量模型对数据的分类能力。实际上，还有另一个更加著名的度量标准，VC维。此概念由Vladimir Vapnik与Alexey Chervonenkis提出。 定义： ... 190

« 1 »

迈向通用人工智能AGI之路：大型语言模型LLM技术精要-9

迈向通用人工智能AGI之路：大型语言模型LLM技术精要-5

理解计算：从根号2到AlphaGo -20: 第8季 深度学习发展简史

理解计算：从根号2到AlphaGo -15: 第6季 多维的浪漫：统计学习理论与支持向量机-3

理解计算：从根号2到AlphaGo -20: 第8季深度学习发展简史

理解计算：从根号2到AlphaGo -15: 第6季多维的浪漫：统计学习理论与支持向量机-3