阿里新模型Qwen 2.5 Max,多项基准测试表现优于DeepSeek V3
来源:林慧宇 发布时间:2025-02-07 分享至微信

阿里巴巴表示其「通义千问」系列新模型Qwen 2.5 Max在多项基准测试中表现优于DeepSeek V3。该模型采用超大规模混合专家模型架构,并使用超过20万亿个token进行训练。


相比之下,DeepSeek V3使用14.8万亿个token。在基准测试中,Qwen 2.5 Max表现出色,与DeepSeek V3、Claude 3.5 Sonnet和GPT-4o模型不相上下。


据加州大学柏克莱分校开发的基础测试平台Chatbot Arena数据显示,Qwen 2.5 Max在农历新年期间跃升至该平台排行榜第七名,成为中国排名第一的非推理AI模型。


尽管DeepSeek R1仍是中国排名最高的AI模型,位居第三,但Qwen 2.5 Max的崛起显示出阿里巴巴在AI领域的实力。


此外,Chatbot Arena指出,前10名中有4家是中国公司,这反映出中国在AI领域正极力追赶美国的差距。除了阿里巴巴和DeepSeek,另一家中国AI新创公司智谱AI也在前10名中占有一席之地。

[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!