英特尔宣称Gaudi2 AI训练效能超越NVIDIA A100-icspec

英特尔宣称Gaudi2 AI训练效能超越NVIDIA A100

来源:杨智家发布时间:2022-07-07

分享至微信

Habana Gaudi2 AI处理器整体尺寸不小，中间Guadi2处理器两侧可见配置6个高带宽存储器块。英特尔

随着英特尔(Intel)在5月揭露其第二代Habana Gaudi2 AI处理器及其部分初步效能数据后，英特尔内部再对第2代Habana Gaudi2 AI处理器进行MLPerf基准测试，宣称达超越NVIDIA A100 GPU的训练效能水准，称Habana Gaudi2 AI处理器展现比竞争对手产品更清晰的训练效能领先地位。

根据HotHardware报导，Habana Gaudi2 AI处理器面积不小，内建于中间的Guadi2处理器两侧，有配置6个高带宽存储器块(tile)，有效将封装存储器容量从前一代版本的32GB，提升至最新一代的96GB HBM2E，提供达2.45TB／s带宽。

英特尔内部最新基准测试显示，第2代Habana Gaudi2 AI处理器比首代Gaudi处理器在训练时间(TTT)上有大幅进步。英特尔展示在MLPerf ResNet-50及MLPerf BERT训练时间上的比较，在8个加速器服务器基准测试下，Gaudi2处理器所需训练时间皆比NVIDIA A100为少。

从英特尔公布的效能基准测试结果，显示在ResNet-50及BERT训练时间上，分别提升最高达45%和35%；与首代Gaudi处理器比较，更分别提升达3倍、4.7倍。ResNet是一种视觉、图像识别模型，BERT则用于自然语言处理，皆为AI和ML关键领域，并都是产业标准模型。

英特尔指出，这些进步可归因于从16纳米向7纳米制程的演进，Tensor Processor Core内建数量增加2倍、增加了GEMM引擎运算能力、内建高带宽存储器容量增加2倍，提高了带宽及让SRAM大小增加1倍。英特尔表示，对于视觉模型，Gaudi2处理器具备整合媒体引擎形式的新功能，其独立运行，可以处理压缩影像的整个预处理管道，包括AI训练所需的数据增强(data augmentation)。

Gaudi系列处理是采异构运算架构，包含2颗运算引擎，分别是Matrix Multiplication Engine (MME)以及一个完全可程序化的Tensor Processor Core(TPC)丛集。

英特尔在2019年以20亿美元买下Habana Labs，期能在与NVIDIA于AI以及机器学习(ML)训练方面的竞争上，助英特尔一臂之力。外界分析，由于NVIDIA经常宣称在MLPerf产业标准基准上的效能优势，如今英特尔公布其Gaudi2 处理器内部MLPerf效能测试结果，不言可喻。

责任编辑：张兴民

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：DIGITIMES科技网，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]