Tenstorrent发布Blackhole AI加速器,性能挑战NVIDIA A100
来源:ictimes 发布时间:2024-09-05 分享至微信

RISC-V芯片创新者Tenstorrent在Hot Chips大会上宣布了革命性的Blackhole AI加速器。


这款芯片以32GB GDDR6内存为基础,通过10条400 Gbps连接,提供高达1TBps带宽,FP8精度下实现745 TFLOPS,FP16下也达372 TFLOPS,自称在计算力与扩展性上超越NVIDIA A100。


Blackhole设计支持水平扩展,可构建包含32颗加速器的Blackhole Galaxy系统,预计FP8下提供23.8 PetaFLOPS,FP16下为11.9 PetaFLOPS,是NVIDIA HGX/DGX A100系统的4.8倍快。未来,其主要竞争对手或将是NVIDIA的HGX/DGX H100和H200系统。


每颗Blackhole内置16颗64位RISC-V大核与752颗小核,协同140颗Tensix核心(含5颗小核、路由器、运算复合体及L1缓存),专为AI优化。Tenstorrent还推出了TT-Metalium编码模型,简化API,配合TT-NN、TT-MLIR等,旨在实现AI模型的高效执行。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!