阿里新模型Qwen 2.5 Max,多项基准测试表现优于DeepSeek V3
来源:林慧宇 发布时间:2025-02-07
分享至微信

阿里巴巴表示其「通义千问」系列新模型Qwen 2.5 Max在多项基准测试中表现优于DeepSeek V3。该模型采用超大规模混合专家模型架构,并使用超过20万亿个token进行训练。
相比之下,DeepSeek V3使用14.8万亿个token。在基准测试中,Qwen 2.5 Max表现出色,与DeepSeek V3、Claude 3.5 Sonnet和GPT-4o模型不相上下。
据加州大学柏克莱分校开发的基础测试平台Chatbot Arena数据显示,Qwen 2.5 Max在农历新年期间跃升至该平台排行榜第七名,成为中国排名第一的非推理AI模型。
尽管DeepSeek R1仍是中国排名最高的AI模型,位居第三,但Qwen 2.5 Max的崛起显示出阿里巴巴在AI领域的实力。
此外,Chatbot Arena指出,前10名中有4家是中国公司,这反映出中国在AI领域正极力追赶美国的差距。除了阿里巴巴和DeepSeek,另一家中国AI新创公司智谱AI也在前10名中占有一席之地。
[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

林慧宇
开创IC领域,共创美好未来!
查看更多
相关文章
阿里即将发布基于Qwen2.5-MAX的深度推理模型
2025-02-21
阿里巴巴发布新款多模态AI模型Qwen2.5-Omni
2025-03-27
阿里云开源QwQ-32B推理模型,性能比肩DeepSeek-R1
2025-03-08
DeepSeek开源模型网安风险引争议
2025-02-17
传DeepSeek加速发布R2 AI模型
2025-02-26
热门搜索
Arm数据中心CPU市占有望升至50%
中美34%关税!对半导体产业影响几何?
华为
台积电
中芯国际
联发科
高通
英特尔
芯片