英伟达Blackwell芯片存过热问题,客户部署计划面临推迟
来源:ictimes 发布时间:2024-11-19 分享至微信

英伟达的下一代Blackwell AI芯片在高容量服务器环境中遭遇了严峻的过热问题,导致了设计的重大调整和生产延误。这一技术难题不仅影响了芯片的性能表现,还对其客户的部署时间表构成威胁,包括谷歌、Meta和微软等行业巨头。


知情人士透露,当Blackwell GPU被安装在每个拥有72个芯片的服务器机架上时,设备的功耗可高达120kW,严重的过热问题使得GPU的性能无法充分发挥,且存在硬件损坏的风险。这迫使英伟达重新评估其服务器机架的设计,并多次进行修改,以提升冷却效果并降低过热风险。


尽管这些调整属于大规模技术发布中常见的现象,但仍不可避免地导致了生产延误。英伟达表示,尽管面临挑战,他们与供应商和云服务提供商的密切合作将帮助解决这些技术难题,确保最终产品能够满足客户对性能和可靠性的高标准。


此前,Blackwell芯片也因设计缺陷而推迟生产,增加了客户的不安。预计这些修订版将在明年1月下旬开始发货,但芯片的延迟无疑将影响客户的业务计划,特别是在AI和云计算领域的应用进程。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!