AI推理重大进展，OpenAI o3模型在测试中取得突破性高分-icspec

AI推理重大进展，OpenAI o3模型在测试中取得突破性高分

来源:赵辉发布时间:5 天前

分享至微信

OpenAI最新推出的o3模型在高难度ARC-AGI基准测试中表现出色，标准版得分75.7%，高运算版更是高达87.5%。这一成绩标志着AI推理潜能的重大进展，尽管o3尚未达到通用人工智能（AGI）水平。

ARC-AGI测试旨在评估AI系统对创意任务的适应能力和流动智能。它包含一系列基于物体、边界和空间关系的视觉拼图，对人类而言轻松，但对多数AI模型却极具挑战。

此前，o1-preview和o1模型在ARC-AGI测试中得分仅为32%，而Claude 3.5 Sonnet曾以53%的得分领先。然而，OpenAI的GPT系列模型在ARC-AGI测试中表现不佳，GPT-3得分为0，GPT-4o也仅得5%。这表明处理ARC问题的能力与模型规模无直接关联。

ARC创作者François Chollet认为，o3的突破是AI模型发展的重要里程碑，展现了前所未有的创新任务适应力。这标志着AI模型已超越过去大型语言模型（LLM）的局限，向真正的人类智能迈进。

然而，o3执行ARC任务的成本高昂，标准版解决单个拼图问题需耗费17~20美元和3,300万个词元，高运算版成本更是标准版的172倍。

[ 新闻来源：赵辉，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

赵辉

开创IC领域，共创美好未来!

2024-12-24

5 天前

2024-12-24

2024-12-23

2024-12-01

热门搜索