AI系统通过图灵测试:GPT-4.5胜率高达73%
来源:万德丰 发布时间:2025-04-02
分享至微信

美国加州大学圣地亚哥分校近日发布了一项研究成果,首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。
图灵测试由英国数学家阿兰・图灵于1950年提出,被称为“模仿游戏”。测试中,提问者需通过文本交流区分对方是机器还是人类。如果提问者无法准确辨别,那么该机器可能被认为具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器对话,并判断哪一方是人类。
研究测试了三款AI模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。实验中,人类参与者通过分屏界面与一名人类和一台AI系统进行五分钟的对话,结束后需判断哪一方是人类。
研究人员在两种模式下评估了这些AI模型的表现:基础指令(NO-PERSONA)模式和增强型PERSONA模式。后者引导AI模拟特定的人类行为特征。结果显示,在PERSONA模式下,GPT-4.5的胜率高达73%,表明提问者常将其误认为是人类;Llama 3.1-405B的胜率约为56%;而在NO-PERSONA模式下,GPT-4o的胜率仅为21%。
对话内容主要围绕日常闲聊展开,其中61%的互动涉及日常生活和个人细节,50%的互动则探讨社会和情感层面,如观点、情感、幽默感和个人经历。
研究报告指出:“如果提问者无法可靠地区分人类与机器,那么该机器即被认为通过了图灵测试。”基于这一标准,GPT-4.5和Llama 3.1-405B在启用PERSONA模式时均通过了测试。
研究人员认为,这些AI系统在依赖简短对话的经济角色中,有望补充甚至取代人类劳动力。此外,这些系统可能成为难以区分的替代品,适用于从在线陌生人对话到与朋友、同事乃至浪漫伴侣的交流等场景。
[ 新闻来源:万德丰,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

万德丰
开创IC领域,共创美好未来!
查看更多
相关文章
OpenAI即将发布GPT-4.5
2025-02-14
OpenAI发布GPT-4.5,性能显著提升
2025-03-02
GPU资源耗尽,OpenAI分阶段发布GPT-4.5
2025-03-04
OpenAI发布GPT-4.5:性能大幅提升、定价惊人
2025-03-03
OpenAI CEO揭秘GPT-4.5:体验升级与资源挑战
2025-03-02
热门搜索
Arm数据中心CPU市占有望升至50%
中美34%关税!对半导体产业影响几何?
华为
台积电
中芯国际
联发科
高通
英特尔
芯片