AI推理重大进展,OpenAI o3模型在测试中取得突破性高分
来源:赵辉 发布时间:5 天前 分享至微信

OpenAI最新推出的o3模型在高难度ARC-AGI基准测试中表现出色,标准版得分75.7%,高运算版更是高达87.5%。这一成绩标志着AI推理潜能的重大进展,尽管o3尚未达到通用人工智能(AGI)水平。


ARC-AGI测试旨在评估AI系统对创意任务的适应能力和流动智能。它包含一系列基于物体、边界和空间关系的视觉拼图,对人类而言轻松,但对多数AI模型却极具挑战。


此前,o1-preview和o1模型在ARC-AGI测试中得分仅为32%,而Claude 3.5 Sonnet曾以53%的得分领先。然而,OpenAI的GPT系列模型在ARC-AGI测试中表现不佳,GPT-3得分为0,GPT-4o也仅得5%。这表明处理ARC问题的能力与模型规模无直接关联。


ARC创作者François Chollet认为,o3的突破是AI模型发展的重要里程碑,展现了前所未有的创新任务适应力。这标志着AI模型已超越过去大型语言模型(LLM)的局限,向真正的人类智能迈进。


然而,o3执行ARC任务的成本高昂,标准版解决单个拼图问题需耗费17~20美元和3,300万个词元,高运算版成本更是标准版的172倍。


[ 新闻来源:赵辉,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!