在今天,几乎在每一个行业中都能找到人工智能(AI)的身影,AI正真切地改变着人们日常生活的诸多方面。2018年7月,FPGA巨头赛灵思宣布收购深鉴科技,正式进军AI领域。2019年,赛灵思推出Vitis统一软件平台,无需专业硬件知识,开发者就可以用软件或算法代码自动适配和使用赛灵思硬件架构,以此支持软件工程师和
AI 科学家在内的广大开发者突破藩篱,踊跃创新。2020年,赛灵思Vitis不断更新并推出Vitis
AI等版本,持续驱动更多的开发者借助硬件加速的力量,解决现实中不同工作负载带来的痛点。近日,更是联手Hackster.io在全球范围内推出令所有开发者瞩目的赛灵思自适应计算挑战赛(Xilinx
Adaptive Computing
Challenge),借先进的开发板、专业的技术专家团队和数十万美元丰厚奖金,揭开全球独立开发者和初创企业基于自适应计算平台竞技的序幕。
大大降低应用门槛的工具和软件,如火如荼的竞赛战鼓,整合深鉴科技两年的赛灵思将在AI领域掀起怎样的波澜?让我们从赛灵思产品市场营销、AI、软件和生态系统总监Nick
Ni的视角,了解赛灵思对于AI产业与发展趋势的洞察,以及赛灵思持续加注AI领域的举措与自适应计算的优势。EET:很多企业都在举办开发者竞赛,赛灵思的初衷是什么?Nick Ni:赛灵思自适应计算挑战赛不仅面向独立开发者,也面向广大初创企业。在开发者挑战赛中,开发者可以使用 Vitis/Vitis AI
在三个平台中选定其一开发应用,包括Zynq UltraScale+ MPSoC ZCU104 评估套件、Alveo U50 加速器卡和Avnet
Ultra96-V2
开发板(8月15日之前可以申请免费租借硬件)。无论是智慧城市、ADAS、机器人视觉、医疗成像等智能视频分析,还是金融科技、机器学习、计算存储等工作负载加速,再或者是任意物联网应用,我们都鼓励开发者充分发挥Vitis和Vitis
AI的出色能力,采用新颖、创新的方式解决实际问题。我们为三个平台的冠、亚、季军共计准备了 5.4
万美元的奖金!初创企业挑战赛冠亚季军的总价奖金额更是超过15万美元。感兴趣的朋友可以前往赛灵思网站了解详情。Nick Ni:众所周知,AI
有两个截然不同的阶段——训练和推断。AI训练已经相对成熟,并且目前正为AI产业贡献大部分收入。相比而言,AI推断只能算是处于起步阶段。但是随着AI模型逐渐“产品化”,也就是将AI
模型转化为可投产的 AI 应用,AI 推断所带来的收入有望很快超越 AI 训练收入。尽管如此,AI推断仍存在大量的创新和改善空间。与常规算法相比,现代 AI 模型所需的算力面临数量级增长,数据流中的每种 AI
模型也都承担着沉重负荷并日益复杂化,由此导致AI 推断对硬件的需求随之大幅增长。如何才能让硬件跟上不断增长的 AI
推断需求呢?我们的答案是DSA(特定领域架构)。DSA 代表着未来计算趋势,因为它是为“每种类型的工作负载”定制自适应硬件,以实现最高的运行效率。Nick Ni:每个 AI 网络都具备三种需要适配和定制才能实现最高效率的计算组件,即定制数据路径、定制精度和定制存储器层级。大多数新兴 AI
芯片都配备了功能强大的引擎,但因为在这三个方面的低效性而无法快速地传输数据。每种 AI
模型所需的DSA架构各有差异,有时略有不同,有时却千差万别。定制数据路径要同步所有层的数据处理,确保数据一直可用于开始下一层的处理;定制精度根据最近的研究证实,要在每个网络中的一个混合精度组合的最佳点上才能实现最高效率;定制存储器层级为例作为最为关键的组件,同时也最需要硬件灵活应变能力,需要从内部存储器到外部
DDR/HBM 建立定制存储器层级,才能满足这样的层间存储器传输需求。图:DSA中,每个 AI 网络都具备三种需要定制的组件Nick Ni:由于每个 AI 模型都需要定制 DSA 才能发挥最高效率,AI 的应用用例正在快速增长。基于 AI
的分类、对象检测、细分、语音识别和推荐引擎只是其中一些已经实现产品化的 AI
用例,如今每天都在涌现大量全新的应用。另外,这种复杂的增长背后还蕴含着另一个维度:在每个应用内部,有更多模型被开发出来,或用于提高准确性,或用于简化模型。相比于需要重新设计新的
ASIC、CPU 和 GPU,赛灵思 FPGA 和自适应计算器件能够在单节点/单器件内从硬件架构到软件层适配最先进的 AI
网络,无疑将为厂商节省巨大的巨大的成本和时间。Nick Ni:持续的AI用例创新给现有硬件带来巨大压力,也迫使芯片厂商快速创新。同时,技术趋势的不断演变也推升了对新 DSA 的需求。与先进的 GPU
相比,赛灵思 FPGA 和自适应计算器件的内部存储器是其 8 倍,且存储器层级完全可由用户定制。对于深度卷积等现代网络而言,这是实现硬件“可用”TOPS
的关键。用户可编程 FPGA
逻辑允许以最高效的方式实现定制层,从而避免其成为系统瓶颈。对于稀疏神经网络,赛灵思长期以来一直在部署大量基于稀疏矩阵的信号处理应用,例如通信域应用。用户能够在
FPGA 架构中设计专用编码器、解码器和稀疏矩阵引擎。最后对于二进制和三进制,赛灵思 FPGA 使用查找表 (LUT) 实现位级操作,在使用二进制替代整数 8
位时,可获得接近 1PetaOps (1000 TOPS) 的性能。运用所有的硬件自适应特性,可以在所有现代 AI 推断工作负载中发挥出接近 100%
的硬件峰值性能。现在通过使用软件开发解决方案,就能让赛灵思器件具备这样的能力。赛灵思已开发出新的统一软件平台 Vitis™,它将 AI 和软件开发合二为一,便于开发者使用
C++/python、AI 框架和库为他们的应用加速。
[ 新闻来源:电子工程专辑,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
全部评论