超微MI355X GPU挑战NVIDIA AI芯片霸主地位
来源:龙灵 发布时间:2 天前 分享至微信
据媒体报道,在3月17日至21日举行的NVIDIA GTC大会期间,AI领域正悄然发生重要变化。尽管NVIDIA以超过90%的市占率稳居AI芯片市场主导地位,但其主要竞争对手超微(AMD)正通过新一代Instinct MI355X GPU系列试图撼动其地位。

日前,甲骨文(Oracle)在2025财年第3季度法说会上透露,已与超微签署价值数十亿美元的合约,将部署包含3万张MI355X算力卡的AI集群。甲骨文董事长Larry Ellison表示,选择超微的原因在于能够打造比竞争对手更快、更经济实惠的巨型AI集群。这种速度优势在按小时计费模式下直接转化为成本优势,成为吸引客户的关键。

业界分析认为,超微MI355X在规格上表现出色,直指NVIDIA的B300系列。MI355X采用台积电3纳米制程和全新CDNA 4架构,配备288GB HBM3E高带宽存储器,带宽达8TB/秒。此外,其FP4和FP6数据类型支持能力,进一步提升了AI训练和推理性能。单平台八卡配置下,可提供总计2.3TB的HBM3E存储器和64TB/s的带宽。

与此同时,超微与联想的合作也备受关注。据智通财经报道,联想集团推出的首款超微AI大模型训练服务器联想问天WA7785a G3,单机部署“满血版”DeepSeek大模型时,可实现极限输送量6,708 token/s。这一突破是联想与超微联合设计、协同调优的结果。双方计划在AI PC和服务器领域展开更深入合作,客户包括微软、Meta及甲骨文等。

不过,超微与联想的合作仍需遵循美国出口管制法规。据外媒Tom's Hardware报道,超微输往中国的MI308属于降规版,可能参照MI300的192GB HBM3配置,其他算力参数也符合限制范围。

从市场布局来看,超微MI355X预计于2025年中上市,目标直指NVIDIA B100和B200系列。其存储器规格为12层288GB HBM3E,高于B200的8层192GB,与B300持平。此外,MI355X的FP16/FP8算力与B200/B300基本相当,FP4算力则对标B200。

在软件生态方面,超微持续推进ROCm开放软件生态,并针对DeepSeek R1和V3模型对MI300X和Ryzen AI架构进行优化。

业界认为,超微MI355X的推出或将缩小与NVIDIA的技术代差,而甲骨文的大单采购也被视为对超微产品的认可。未来,超微有望获得更多来自微软、Meta等一线云端运算客户的订单。

[ 新闻来源:龙灵,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!