阿里巴巴通义千问挑战DeepSeek,低成本部署成亮点
来源:赵辉 发布时间:4 天前
分享至微信

近日,阿里巴巴AI模型“通义千问”(Qwen)加速追赶DeepSeek-R1。DeepSeek作为中国业界热门AI大模型,备受瞩目。而阿里巴巴则宣布未来三年将投入超3800亿元用于云端和AI硬件建设,创中国民企之最。
阿里巴巴最新发布的开源推论模型QwQ-32B,参数规模320亿,性能却比肩6710亿参数的DeepSeek-R1。
更引人注目的是,QwQ-32B的部署成本大幅降低,只需NVIDIA RTX 4090增强版即可,成本仅为DeepSeek-R1的十分之一。用户还可通过通义App免费体验该模型。
QwQ-32B的成功在于其高性价比,得益于阿里巴巴采用的不同技术路线——密集架构(Dense),而非DeepSeek的混合专家系统(MoE)。此外,阿里巴巴通义团队还进行了两轮大规模强化学习,提升了模型性能。
截至目前,通义千问的衍生模型数量已突破10万,成为全球最大开源模型族群。阿里巴巴正积极承接AI红利,拟在这一波竞赛中拔得头筹。
然而,尽管QwQ-32B性能强劲,但市场回馈仍需时间观望,LLM从“能用”到“好用”仍需实际应用检验。
[ 新闻来源:赵辉,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

赵辉
开创IC领域,共创美好未来!
查看更多
相关文章
阿里云通义千问Qwen2.5-Max登顶AI大模型榜单
2025-02-06
DeepSeek低成本AI模型引发热议,NVIDIA面临挑战
2025-02-10
苹果中国AI服务携手阿里巴巴
2025-02-14
热门搜索
现代汽车韩国新建氢燃料电池系统工厂
陈立武出任英特尔CEO
华为
台积电
中芯国际
联发科
高通
英特尔
芯片