OpenAI 公布其大型语言模型的最新版本 GPT

听音频 🔊 . 看视频 🎦

... 2023-03-16 07:00 .. 甚至在许多标准化测试中比人类表现得更好。
    OpenAI表示，GPT-4在专业和学术方面表现出近似于人类的水平。
    例如，它在模拟律师考试中的得分能够排进前10%左右，相比之下，GPT-3.5的得分只能排在倒数10%左右。
    不过，OpenAI也警告称，GPT-4还不完美，在许多情况下，它的能力不如人类。
    该公司表示：“GPT-4仍有许多已知的局限性，我们正在努力解决，比如社会偏见、幻觉和对抗性提示.”
    OpenAI透露，摩根士丹利正在使用GPT-4来组织数据，而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。
    其他客户还包括语言学习公司Duolingo、KhanAcademy和冰岛政府。
    值得注意的是，GPT-4虽然于14日才正式公开，但早在一个月前，微软的新版搜索引擎Bing就已经在GPT-4上运行。
    微软表示，“如果您在过去五周内的任何时间使用过新版Bing， .. UfqiNews ↓ 13

-loading-

... 04-18 03:42 , 8499 , 188 ..
[编按：转载于新浪网/李德林, 2023-04-17. ]

中国人工智能AI大语言模型LLM的道场

熙熙攘攘这命运的道场，曾燃起希望烧一片空旷.
    现在，人工智能的大模型犹如修行的道场，在2023年的春天百花争鸣.
    如果手上没有一本《山海经》，都已经看不懂科技巨头们在人工智能领域的群雄逐鹿了.
    AI的赛道上已经拥挤不堪，谁能成为最后的赢家？
(美国OpenAI公司的聊天人工智能机器人)ChatGPT一出，科技界、学术界一片沸腾，比尔盖茨、扎克伯格、马斯克、巴菲特都卷入了人工智能的狂风暴雨之中.
    砸了千亿，在AI道路上摸爬滚打10年的百度，第一个站出来发布了对标chatGPT的产品文心一言.
    百度的挺身而出，点燃了整个中国的AI大模型激情.

华为的盘古、360的智脑、商汤的日日新、阿里的通义千问、京东的言犀、腾讯的混元、字节的自研、网易的玉言、澜舟科技的孟子、达观数据的曹植、中科院的紫东太初、科大讯飞的1+N认知、浪潮的源1.0、昆仑万维的天工3.5等大模型纷纷登场.
    美团的联合创始人王慧文、搜狗创始人王小川，重出江湖，亲自下注，带动一批资金，再战大模型.

现在的中国人工智能领域，已经从天地未分前的混沌元气，到盘古开天辟地，从孟子的金玉良言，到才高八斗的七步成诗，如果你读书不从《山海经》开始，没有个五千年的文化沉淀，你已经无法看明白科技领域的雄心壮志.
    对于科技界的一众巨 ... 中国人工智能AI大语言模型LLM的道场 ⟶

...

03-19 00:32 , 8056 , 186 ..
[编按：转载于腾讯微信/ 阳志平心智工具箱， 2023-03-18.
     文心一言的理性思维能力距离 GPT-4 差多少？我们第一时间测试了一下.
    ]

百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少?

背景
如果将大语言模型想象成一个人，那么，通过对它的人格、智商、理性与社会情绪能力进行心理测量，是不是可以清晰地描绘出大语言模型的心智成熟程度.
    这就是新兴的人工智能心理测量学.
    只是，在人工智能心理测量学中，我们不再测查人类，而是测查大语言模型以及各类机器人.

在 GPT-4 发布之后，我们第一时间测查了它在理性思维能力测验上的表现，并将其与 GPT-3.5 的结果、253 位受过高等教育的人进行对比.
    结果发现，GPT-4 实现了大跃迁，达到了一个超越人类的水准.

详情参见：理性思维超越人类？GPT-4真正大杀八方的是这项能力
测试流程
在百度文心一言发布之后，我们第一时间获得邀请码，选择了在前文中测试 GPT-3.5 与 GPT-4 一致的题目、流程.
    详细说明请参考前文.
    这里不再啰嗦.

简而言之，我们挑选了认知科学家用来评定人类理性思维的四类经典测试任务：语义错觉类任务；认知反射类任务；证伪选择类任务；心智程序类任务.
    四类任务总计 26 道题目.

在测试之前，我们已经预估文心一言的表现会不如 GPT-4，但最终实际测试结果还是令人大跌眼镜，可能与百度开发团队的认知有关系.
    在下文中，我会略作分析.


需要提醒的是，本报告仅仅是一个早期工作，并不完善.
    测试流程有无数可以改善之处.
    结论未来随时可能被修正、被推翻.
    各位读者请理解.

现在，让我们来详细看看测试结果.

分项测试结果 ... 百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少? ⟶

+版本 +模型 +语言 +人类 +测试

本页Url

↗ 读全文 +评论✍️

↖ 回首页 ↘ 下一篇

👍¹⁰ 仁智互见 👎⁰