阿里巴巴通义千问挑战DeepSeek,低成本部署成亮点
来源:赵辉 发布时间:4 天前 分享至微信

近日,阿里巴巴AI模型“通义千问”(Qwen)加速追赶DeepSeek-R1。DeepSeek作为中国业界热门AI大模型,备受瞩目。而阿里巴巴则宣布未来三年将投入超3800亿元用于云端和AI硬件建设,创中国民企之最。


阿里巴巴最新发布的开源推论模型QwQ-32B,参数规模320亿,性能却比肩6710亿参数的DeepSeek-R1。


更引人注目的是,QwQ-32B的部署成本大幅降低,只需NVIDIA RTX 4090增强版即可,成本仅为DeepSeek-R1的十分之一。用户还可通过通义App免费体验该模型。


QwQ-32B的成功在于其高性价比,得益于阿里巴巴采用的不同技术路线——密集架构(Dense),而非DeepSeek的混合专家系统(MoE)。此外,阿里巴巴通义团队还进行了两轮大规模强化学习,提升了模型性能。


截至目前,通义千问的衍生模型数量已突破10万,成为全球最大开源模型族群。阿里巴巴正积极承接AI红利,拟在这一波竞赛中拔得头筹。


然而,尽管QwQ-32B性能强劲,但市场回馈仍需时间观望,LLM从“能用”到“好用”仍需实际应用检验。


[ 新闻来源:赵辉,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!