《自然》杂志惊人发现:AI解读心理能力堪比甚至超越人类

【HowToTech科技】5月26日消息,近期,一篇关于人工智能的研究论文在《自然-人类行为》期刊上发表,揭示了AI大语言模型在追踪他人心理状态能力任务中的惊人表现。据论文第一作者、德国汉堡-埃彭多夫大学医学中心的James
W. A. Strachan及其团队的研究,两类AI大语言模型在特定情况下,展现出了与人类相似甚至超越人类的心智理论能力。

心智理论,这一对人类社交互动至关重要的能力,是人们沟通交流和产生共鸣的基石。为了深入探索AI在这方面的能力,研究团队精心挑选了多项任务,包括发现错误想法、理解间接言语以及识别失礼等,以全面测试AI的心智理论水平。

据HowToTech科技了解,该研究选用了当前热门的GPT和LLaMA2两个大语言模型进行实验,并与1907名人类参与者的表现进行了对比分析。结果令人瞩目:GPT模型在识别间接要求、错误想法和误导方面的表现不仅达到了人类的平均水平,甚至在某些情况下超越了人类;而LLaMA2模型虽然整体表现逊于人类,但在识别失礼方面却展现出了优于人类的能力。

然而,研究团队也指出,LLaMA2在识别失礼方面的成功并非真正源于对失礼的敏感,而是因为其回答的“偏见程度”相对较低。相比之下,GPT在坚持结论时表现出的“超保守”态度,可能是其在某些任务中表现不佳的原因,而非推理错误。

大鱼的头像

这个人很懒,什么都没有留下~

延伸阅读:

OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens

【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...

大鱼的头像
大鱼
2024 年 8 月 1 日
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战

7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...

大鱼的头像
大鱼
2024 年 7 月 31 日
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型

“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...

大鱼的头像
大鱼
2024 年 7 月 31 日
阿里通义免费开放奥运AI大模型

7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以...

大鱼的头像
大鱼
2024 年 7 月 31 日
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...

大鱼的头像
大鱼
2024 年 7 月 31 日