采用Blackwell加速器,NVIDIA DGX B200系统效能显著提升
来源:ictimes 发布时间:14 小时前 分享至微信

NVIDIA近期发布的DGX B200系统,采用Blackwell加速器,在MLPerf基准测试中表现出色。在FP8、FP16、BF16和TF32精准度下,其巅峰浮点效能较上一代H100系统提高2.27倍。


在微调700亿参数的Llama 2模型和预训练1,750亿参数的GPT-3模型时,B200整体效能也分别高出H100系统2.2倍和2倍。


此外,NVIDIA表示,Blackwell加速器的浮点运算效能和存储器带宽优于Hopper加速器,64颗Blackwell GPU即可提供等同于256颗Hopper GPU在运行GPT-3基准时的效能。


B200系统可为稀疏FP8提供9 petaFLOPS的效能,而旗舰款GB200在1.2KW耗电量和发热量下,可提供10 petaFLOPS的效能。


NVIDIA还参照NVL72设计,将NVLink连接的GPU域从8颗扩充到72颗加速器,从而提升了系统效能。值得注意的是,目前公布的基准测试对象为标准版B200系统,系统效能有望通过软件调校和网络基础设施的改良进一步提升。


相比之下,Google近期公布的第六代TPU Trillium在MLPerf基准测试中的效能提升近4倍,但整体仍难敌NVIDIA的系统效能。然而,训练神经网络所需消耗的庞大电力仍是市场上的隐忧,需引起关注。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!