用AI训练AI，可能越练越“傻”

-loading-

听音频 🔊 . 看视频 🎦

... 2024-08-01 17:20 .. 大语言模型来说，通常给予的训练数据越多，模型就会越“聪明”。
    但英国《自然》杂志新发表的一项关于大模型的研究显示，如果只用AI生成的数据来训练大模型，会使模型性能下降、越练越“傻”。
    英国牛津大学、剑桥大学等机构研究人员发现，如果在训练大模型时，只用AI生成的内容，会导致大模型出现不可逆的缺陷，逐渐忘记真实数据的分布，这被称为“模型崩溃”。
    研究人员首先使用大语言模型创建类似维基百科词条的文本，然后利用这个内容来训练该模型的新版本，并反复使用前代模型生成的文本训练更新的版本。
    随着AI生成的信息“污染”训练集，模型的输出逐渐失去意义。
    在模型的第九次迭代中，它完成了一篇关于英国教堂塔楼的文章，其中一段文字却在讲述野兔尾巴的多种颜色。
    研究发现，导致“模型崩溃”的重要原因是，由于模型只能从其训练数据中采样，一些在第一代数据中本就低频出现的词汇，在每次迭代后出现的频率变得更 .. UfqiNews ↓ 1