DNA 100处理器适用于汽车、监控、机器人、无人机、AR / VR、智能手机、智能家居和物联网产品的神经网络推理,可轻松从0.5扩展至100TMAC
本文引用地址:http://www.eepw.com.cn/article/201811/394337.htm楷登电子(美国 Cadence公司,NASDAQ:CDNS)今日推出Cadence
神经网络的特征在于权重和激活函数的固有稀疏度,加载和乘以零会造成其他处理器不必要的MAC消耗。DNA 100处理器的专属硬件计算引擎移除了上述两项任务,利用稀疏度提高能效并降低计算量。神经网络再训练有助于提高网络的稀疏度,并通过DNA 100处理器的稀疏计算引擎实现最高性能。DNA 100处理器能够利用更小的阵列实现最大吞吐量。作为例证,4K MAC配置环境下,ResNet 50推理性能预计能实现每秒高达2550帧(fps)和3.4TMAC /W(在16 nm工艺)。
“人工智能处理器的应用发展迅速,但是运行最新的神经网络模型会使功耗预算严重缩紧。”Linley Group资深分析师Mike Demler说道。“满足从小型电池供电的物联网传感器到自动驾驶汽车等设备的人工智能功能需求,需要更高效的架构。Cadence全新Tensilica DNA 100处理器采用的创新稀疏计算引擎解决了这些局限性,在任何功耗预算下均能提供优秀性能。”
DNA 100处理器配备完整的AI软件平台,兼容最新版本的Tensilica神经网络编译器(Tensilica Neural NetworkCompiler),支持Caffe、TensorFlow、TensorFlow Lite及包括卷积和循环网络在内的广泛神经网络等高级AI框架。因此,DNA 100处理器是视觉、语音、雷达、激光雷达和通信应用设备端推理的理想之选。 Tensilica神经网络编译器利用全面优化的神经网络库函数,将任意神经网络映射为可执行且高度优化的高性能代码。因此,DNA 100处理器为不同网络类型提供了强大的软件生态系统支持,包括分类、对象检测、分割、重复和回归。 DNA 100处理器还支持安卓神经网络(ANN)API,可用于安卓设备端的AI推理。
DNA 100处理器可以在所有神经网络层运行,包括卷积、完全连接、LSTM、LRN和池化。单个DNA100处理器可以轻松从0.5扩展到12有效TMAC;并可以通过堆叠多个DNA 100处理器,实现数百TMAC,适用于最计算密集型设备端的神经网络应用。 DNA 100处理器还集成了Tensilica DSP,以适应DNA 100处理器内部硬件引擎当前不支持的新神经网络层;同时使用Tensilica指令扩展(TIE)指令集实现Tensilica Xtensa核心的可扩展性和可编程性。由于DNA 100处理器拥有独立的直接存储器访问(DMA),因此无需新增控制器即可运行其他控制代码。
“我们客户的神经网络推理需求涉及不同量级的人工智能处理和多种神经网络类型。他们需要一种可扩展的架构,无论在低端物联网应用,还是在汽车应用,都具备同样有效,做到这一点需要数十甚至数百TMAC,”Cadence Tensilica IP产品管理和营销高级总监Lazaar Louis表示。 “凭借DNA100处理器、完整的AI软件平台、以及强大的合作伙伴生态系统,我们的客户可以设计出设备端AI推理所需的高性能和高能效产品。”
DNA 100处理器将于2018年12月面向部分客户出售,预计于2019年第一季度全面上市。
关于楷登电子Cadence
Cadence 公司致力于推动电子系统和半导体公司设计创新的终端产品,以改变人们的工作、生活和娱乐方式。客户采用 Cadence的软件、硬件、IP 和服务,覆盖从半导体芯片到电路板设计乃至整个系统,帮助他们能更快速向市场交付产品。Cadence 公司创新的“系统设计实现” (SDE)战略,将帮助客户开发出更具差异化的产品,无论是在移动设备、消费电子、云计算、汽车电子、航空、物联网、工业应用等其他的应用市场。Cadence 公司同时被财富杂志评选为“全球年度最适宜工作的100家公司”之一。
暂无评论哦,快来评论一下吧!