AI系统通过图灵测试：GPT-4.5胜率高达73%-icspec

AI系统通过图灵测试：GPT-4.5胜率高达73%

来源:万德丰发布时间:2025-04-02

分享至微信

美国加州大学圣地亚哥分校近日发布了一项研究成果，首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。

图灵测试由英国数学家阿兰・图灵于1950年提出，被称为“模仿游戏”。测试中，提问者需通过文本交流区分对方是机器还是人类。如果提问者无法准确辨别，那么该机器可能被认为具备类似人类的智能。在三方图灵测试中，提问者需与一名人类和一台机器对话，并判断哪一方是人类。

研究测试了三款AI模型，包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B，以及OpenAI的GPT-4o。实验中，人类参与者通过分屏界面与一名人类和一台AI系统进行五分钟的对话，结束后需判断哪一方是人类。

研究人员在两种模式下评估了这些AI模型的表现：基础指令（NO-PERSONA）模式和增强型PERSONA模式。后者引导AI模拟特定的人类行为特征。结果显示，在PERSONA模式下，GPT-4.5的胜率高达73%，表明提问者常将其误认为是人类；Llama 3.1-405B的胜率约为56%；而在NO-PERSONA模式下，GPT-4o的胜率仅为21%。

对话内容主要围绕日常闲聊展开，其中61%的互动涉及日常生活和个人细节，50%的互动则探讨社会和情感层面，如观点、情感、幽默感和个人经历。

研究报告指出：“如果提问者无法可靠地区分人类与机器，那么该机器即被认为通过了图灵测试。”基于这一标准，GPT-4.5和Llama 3.1-405B在启用PERSONA模式时均通过了测试。

研究人员认为，这些AI系统在依赖简短对话的经济角色中，有望补充甚至取代人类劳动力。此外，这些系统可能成为难以区分的替代品，适用于从在线陌生人对话到与朋友、同事乃至浪漫伴侣的交流等场景。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：万德丰，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]