英伟达Blackwell架构,可支持10万亿参数模型AI训练
来源:ictimes 发布时间:2024-09-04 分享至微信

在科技界万众瞩目的Hot Chips 2024大会上,英伟达震撼发布了其下一代GPU架构——Blackwell,这一创新之举不仅标志着英伟达在通用计算全栈矩阵领域迈出了决定性的一步,更预示着AI训练与实时大语言模型推理将迎来前所未有的性能飞跃。


Blackwell并非孤立存在,而是由英伟达精心打造的一整套芯片生态系统中的核心成员,包括Grace CPU、BlueField数据处理单元、ConnectX网络接口卡等一系列高端组件,共同编织成一个无懈可击的计算网络。这一架构的推出,是英伟达对生成式AI与加速计算领域深刻洞察与不懈追求的结晶。


Blackwell架构之所以能够引领潮流,关键在于其六大革命性技术:

作为全球最强大的芯片之一,其内置的2080亿个晶体管以及台积电4纳米工艺,确保了前所未有的计算能力与能效比;

第二代Transformer引擎与4位浮点AI支持,将计算与模型大小推理能力推向新的高度;

第五代NVLink技术实现了GPU间的高速无缝通信,为复杂LLM的实时运行提供了坚实保障;

RAS引擎的加入,则让系统更加稳定可靠;

安全人工智能与解压缩引擎的引入,则进一步提升了数据保护与处理效率。


英伟达称,Blackwell可支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理。


相较于英伟达的上一代旗舰架构Hopper,Blackwell在多个维度上实现了显著提升。晶体管数量的激增直接带动了计算能力的爆炸性增长,单个芯片即可达到20 petaFLOPS的惊人性能。同时,更大的HBM3e内存与更高的显存带宽,让数据处理与传输速度再上新台阶。这些优势使得Blackwell在处理大规模AI模型时,能够展现出更加卓越的实时性能与效率。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!