↖  OpenAI 公布其大型语言模型的最新版本 GPT..


OpenAI 公布其大型语言模型的最新版本 GPT

听音频 🔊 . 看视频 🎦

... 2023-03-16 07:00 .. 甚至在许多标准化测试中比人类表现得更好。
    OpenAI表示,GPT-4在专业和学术方面表现出近似于人类的水平。
    例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。
    不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。
    该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示.”
    OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。
    其他客户还包括语言学习公司Duolingo、KhanAcademy和冰岛政府。
    值得注意的是,GPT-4虽然于14日才正式公开,但早在一个月前,微软的新版搜索引擎Bing就已经在GPT-4上运行。
    微软表示,“如果您在过去五周内的任何时间使用过新版Bing, .. UfqiNews 13

-loading- -loading- -loading-


... 04-18 03:42 , 8499 , 188 ..
[编按: 转载于 新浪网/李德林, 2023-04-17. ]

中国人工智能AI大语言模型LLM的道场


熙熙攘攘这命运的道场,曾燃起希望烧一片空旷.
    现在,人工智能的大模型犹如修行的道场,在2023年的春天百花争鸣.
    如果手上没有一本《山海经》,都已经看不懂科技巨头们在人工智能领域的群雄逐鹿了.
    AI的赛道上已经拥挤不堪,谁能成为最后的赢家?
(美国OpenAI公司的聊天人工智能机器人)ChatGPT一出,科技界、学术界一片沸腾,比尔盖茨、扎克伯格、马斯克、巴菲特都卷入了人工智能的狂风暴雨之中.
    砸了千亿,在AI道路上摸爬滚打10年的百度,第一个站出来发布了对标chatGPT的产品文心一言.
    百度的挺身而出,点燃了整个中国的AI大模型激情.
    
华为的盘古、360的智脑、商汤的日日新、阿里的通义千问、京东的言犀、腾讯的混元、字节的自研、网易的玉言、澜舟科技的孟子、达观数据的曹植、中科院的紫东太初、科大讯飞的1+N认知、浪潮的源1.0、昆仑万维的天工3.5等大模型纷纷登场.
    美团的联合创始人王慧文、搜狗创始人王小川,重出江湖,亲自下注,带动一批资金,再战大模型.
    
现在的中国人工智能领域,已经从天地未分前的混沌元气,到盘古开天辟地,从孟子的金玉良言,到才高八斗的七步成诗,如果你读书不从《山海经》开始,没有个五千年的文化沉淀,你已经无法看明白科技领域的雄心壮志.
    对于科技界的一众巨 ... 中国人工智能AI大语言模型LLM的道场 ⟶



... -img-
03-19 00:32 , 8056 , 186 ..
[编按: 转载于 腾讯微信/ 阳志平 心智工具箱, 2023-03-18.
     文心一言的理性思维能力距离 GPT-4 差多少?我们第一时间测试了一下.
    ]

百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少?

背景
如果将大语言模型想象成一个人,那么,通过对它的人格、智商、理性与社会情绪能力进行心理测量,是不是可以清晰地描绘出大语言模型的心智成熟程度.
    这就是新兴的人工智能心理测量学.
    只是,在人工智能心理测量学中,我们不再测查人类,而是测查大语言模型以及各类机器人.
    
在 GPT-4 发布之后,我们第一时间测查了它在理性思维能力测验上的表现,并将其与 GPT-3.5 的结果、253 位受过高等教育的人进行对比.
    结果发现,GPT-4 实现了大跃迁,达到了一个超越人类的水准.
    
详情参见:理性思维超越人类?GPT-4真正大杀八方的是这项能力
测试流程
在百度文心一言发布之后,我们第一时间获得邀请码,选择了在前文中测试 GPT-3.5 与 GPT-4 一致的题目、流程.
    详细说明请参考前文.
    这里不再啰嗦.
    
简而言之,我们挑选了认知科学家用来评定人类理性思维的四类经典测试任务:语义错觉类任务;认知反射类任务;证伪选择类任务;心智程序类任务.
    四类任务总计 26 道题目.
    
在测试之前,我们已经预估文心一言的表现会不如 GPT-4,但最终实际测试结果还是令人大跌眼镜,可能与百度开发团队的认知有关系.
    在下文中,我会略作分析.
    

需要提醒的是,本报告仅仅是一个早期工作,并不完善.
    测试流程有无数可以改善之处.
    结论未来随时可能被修正、被推翻.
    各位读者请理解.
    
现在,让我们来详细看看测试结果.
    
分项测试结果 ... 百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少? ⟶


本页Url


👍10 仁智互见 👎0
  • 还没有评论. → +评论
  • -loading- -loading- -loading-


    🤖 智能推荐

    中国人工智能AI大语言模型LLM的道场 44

    百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少? 百度公司的人工智能文心一言的理性思维能力距离美国OpenAI公司GPT-4差多少? 9

    美国OpenAI的ChatGPT-4发布:多模态图文混合交互 美国OpenAI的ChatGPT-4发布:多模态图文混合交互 21

    专家:ChatGPT尚不具备自主的“心智” 29

    更智慧地使用人工智能工具 27

    OpenAI用GPT OpenAI用GPT 25

    更强更可靠!OpenAI公布GPT 23

    人工智能会导致人类灭亡吗?专家称更担心虚假信息和操纵用户 22

    记者实测文心一言:新闻稿写得怎么样?奥数题能对几道? 21

    考试能力超90%人类的GPT 21

    -loading- -loading- -loading-


    🔥 相关精选

    微软豪赌AI,能让ChatGPT等AIGC工具普及给大众? 19

    周鸿祎:每个行业、企业、个人都将拥有私有化GPT 周鸿祎:每个行业、企业、个人都将拥有私有化GPT 17

    像人类一样“会聊天”!亚马逊的智能音箱将加入“类ChatGPT”功能 16

    多项测试超越90%的人类,GPT 16

    黄学东院士:ChatGPT虽然厉害 但不可能取代人类 15

    OpenAI为节约成本偷工减料?史上最强大模型GPT 14

    OpenAI为节约成本偷工减料?史上最强大模型GPT OpenAI为节约成本偷工减料?史上最强大模型GPT 13

    让人工智能守住“技术向善”底线 12

    考试能力超90%人类的GPT 11

    北森控股通过港交所聆讯,牵手百度“文心一言”,对话式语言模型技术助力人力资源管理转型 10

    十秒做出网站、会看图解题  升级版GPT 十秒做出网站、会看图解题 升级版GPT 10

    2023谷歌I/O大会:AI接管谷歌搜索,Pixel Fold折叠屏来了 2023谷歌I/O大会:AI接管谷歌搜索,Pixel Fold折叠屏来了 8

    谷歌AI大动作来了!最新大语言模型、升级版Bard,还有…… 7

    -loading- -loading- -loading-

     


    + 版图 版图
    AddToFav   
    常在 经典 官宣