英特尔宣称Gaudi2 AI训练效能超越NVIDIA A100
来源:杨智家 发布时间:2022-07-07 分享至微信


Habana Gaudi2 AI处理器整体尺寸不小,中间Guadi2处理器两侧可见配置6个高带宽存储器块。英特尔

Habana Gaudi2 AI处理器整体尺寸不小,中间Guadi2处理器两侧可见配置6个高带宽存储器块。英特尔

随着英特尔(Intel)在5月揭露其第二代Habana Gaudi2 AI处理器及其部分初步效能数据后,英特尔内部再对第2代Habana Gaudi2 AI处理器进行MLPerf基准测试,宣称达超越NVIDIA A100 GPU的训练效能水准,称Habana Gaudi2 AI处理器展现比竞争对手产品更清晰的训练效能领先地位。


根据HotHardware报导,Habana Gaudi2 AI处理器面积不小,内建于中间的Guadi2处理器两侧,有配置6个高带宽存储器块(tile),有效将封装存储器容量从前一代版本的32GB,提升至最新一代的96GB HBM2E,提供达2.45TB/s带宽。


英特尔内部最新基准测试显示,第2代Habana Gaudi2 AI处理器比首代Gaudi处理器在训练时间(TTT)上有大幅进步。英特尔展示在MLPerf ResNet-50及MLPerf BERT训练时间上的比较,在8个加速器服务器基准测试下,Gaudi2处理器所需训练时间皆比NVIDIA A100为少。


从英特尔公布的效能基准测试结果,显示在ResNet-50及BERT训练时间上,分别提升最高达45%和35%;与首代Gaudi处理器比较,更分别提升达3倍、4.7倍。ResNet是一种视觉、图像识别模型,BERT则用于自然语言处理,皆为AI和ML关键领域,并都是产业标准模型。


英特尔指出,这些进步可归因于从16纳米向7纳米制程的演进,Tensor Processor Core内建数量增加2倍、增加了GEMM引擎运算能力、内建高带宽存储器容量增加2倍,提高了带宽及让SRAM大小增加1倍。英特尔表示,对于视觉模型,Gaudi2处理器具备整合媒体引擎形式的新功能,其独立运行,可以处理压缩影像的整个预处理管道,包括AI训练所需的数据增强(data augmentation)。


Gaudi系列处理是采异构运算架构,包含2颗运算引擎,分别是Matrix Multiplication Engine (MME)以及一个完全可程序化的Tensor Processor Core(TPC)丛集。


英特尔在2019年以20亿美元买下Habana Labs,期能在与NVIDIA于AI以及机器学习(ML)训练方面的竞争上,助英特尔一臂之力。外界分析,由于NVIDIA经常宣称在MLPerf产业标准基准上的效能优势,如今英特尔公布其Gaudi2 处理器内部MLPerf效能测试结果,不言可喻。



责任编辑:张兴民



[ 新闻来源:DIGITIMES科技网,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!