璧仞科技发表首款通用GPU 采用台积电7纳米制程制造
来源:DIGITIMES 发布时间:2022-09-13 分享至微信

成功推出BR104和BR100 GPU的璧仞科技,市值已将近30亿美元。 璧仞科技


随着中美贸易战持续升级以及美国的AI晶片出口禁令,中国实现其高效能运算系统的愿望,自行研发国产GPU势在必行。日前璧仞科技在Hot Chips 34大会上发表自行研发的BR104与BR100 GPU产品,为激烈的GPU市场带来更多竞争。


根据The Next Platform报导,前华为海思GPU首席架构师,现任璧仞技术长洪洲表示,璧仞在设计GPU时设定2个目标。首先,不只是做出一个庞大的GPU运算引擎,而是从单一投片(tape out)产出多个GPU产品,此为璧仞一开始就选择小晶片架构的原因。其次,提供一款上市时效能比2019年款GPU高10倍的GPU产品。


璧仞Biren GPU产品命名方式与NVIDIA GPU类似,100型号是针对重度GPU运算,104型号则是针对图形和推论工作负载及运算的较小元件。不过NVIDIA采用不同架构,而璧仞的首发产品中,低阶产品为单个GPU,高阶产品则是透过高速、晶片对晶片互连在一起的2个GPU晶片。


BR100采用小晶片设计理念,让晶片总面积可以突破单晶片的微影尺寸限制,整合更多的运算力和通用性逻辑。加上小晶片良率较高,可以降低成本,提供比单片设计高30%的效能。


Biren GPU的组织方式与其他GPU运算引擎也很类似。每个B104晶片都有16个串流处理器,璧仞称其为串流处理丛集(SPC)。这些SPC共享1个8 MB分散式L2高速快取和暂存记忆体,并透过裸片上的高速网格彼此连接以及外接各种控制器。


BR104晶片是透过1对小裸晶(die-to-die)互连技术实现896 GB/sec连接频宽,与NVLink 4连接埠的900 GB/sec频宽基本相同,如此大频宽的互连表示BR100对软体而言如同单一的GPU。


此外,每个BR104晶片都有一个PCI-Express 5.0控制器和一个BLink互连控制器,具有2组影音编码器,因此BR104晶片不仅仅是运算引擎,也是货真价实的绘图晶片。


Biren GPU架构设计的巧妙之处在于可将EU执行单元动态分配给更高级别的运算单元(CU),每个CU可以有4、8或16个EU,跨执行绪同步,如同是某种虚拟串流处理器。璧仞的软体堆叠称为BirenSUPA,在概念上类似于NVIDIA的CUDA,但两者不相容。

[ 新闻来源:DIGITIMES,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!