阿里新模型Qwen 2.5 Max，多项基准测试表现优于DeepSeek V3-icspec

阿里新模型Qwen 2.5 Max，多项基准测试表现优于DeepSeek V3

来源:林慧宇发布时间:2025-02-07

分享至微信

阿里巴巴表示其「通义千问」系列新模型Qwen 2.5 Max在多项基准测试中表现优于DeepSeek V3。该模型采用超大规模混合专家模型架构，并使用超过20万亿个token进行训练。

相比之下，DeepSeek V3使用14.8万亿个token。在基准测试中，Qwen 2.5 Max表现出色，与DeepSeek V3、Claude 3.5 Sonnet和GPT-4o模型不相上下。

据加州大学柏克莱分校开发的基础测试平台Chatbot Arena数据显示，Qwen 2.5 Max在农历新年期间跃升至该平台排行榜第七名，成为中国排名第一的非推理AI模型。

尽管DeepSeek R1仍是中国排名最高的AI模型，位居第三，但Qwen 2.5 Max的崛起显示出阿里巴巴在AI领域的实力。

此外，Chatbot Arena指出，前10名中有4家是中国公司，这反映出中国在AI领域正极力追赶美国的差距。除了阿里巴巴和DeepSeek，另一家中国AI新创公司智谱AI也在前10名中占有一席之地。

[ 新闻来源：林慧宇，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

林慧宇

开创IC领域，共创美好未来!

2025-02-21

2025-03-27

2025-03-08

2025-02-17

2025-02-26

热门搜索

Arm数据中心CPU市占有望升至50% 中美34%关税！对半导体产业影响几何？华为台积电中芯国际联发科高通英特尔芯片