Arm十年最大升级的V9架构,剑指全面计算,CPU、GPU、系统IP三连发!
来源:电子发烧友网 发布时间:2021-05-27 分享至微信

电子发烧友网报道(文/黄晶晶)今年初,Arm公司发布Armv9架构,这是Arm公司十年来最重大的架构发布。随后,Arm发布了基于V9架构的面向服务器领域的处理器IP Neoverse V1和N2。

近日,Arm再次发布基于V9架构的一系列处理器IP,其中包括Cortex-X2、Cortex-A710、Cortex-A510等,以及Mali GPUIP、系统IP等。我们熟知的此前采用X1架构的处理器主要用于智能手机,而X2也将在今后用于提升智能手机的处理器性能。Arm高级副总裁兼终端事业部总经理Paul Williamson表示,Arm致力于打造全面计算解决方案,面向未来的计算时代,我们不能再简单地用PPA来衡量计算的性能。

Arm Cortex-X2、Arm Cortex-A710、Arm Cortex-A510,CPU全面升级

Arm Cortex-X2是Arm目前性能最强大的CPU,相比较X1它的性能提升16%。除了峰值性能外,Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展,使Arm的合作伙伴可以根据市场需求来设计基于不同场景的计算能力。

Arm Cortex-A710是首款基于Armv9架构的大核CPU,与Cortex-A78相比,能效提升30% ,性能提升10%,机器学习性能翻倍。通过这些性能和效率的提升,当智能手机运行高要求的app时,用户将获得比以往更长的使用时间以及更优化的用户体验。



Arm Cortex-A510是Arm过去四年来推出的首款高效率小核,其性能提升35%,机器学习性能提升超过三倍。它所带来的性能水平已经接近几年前推出的上一代大核,这里前一代大核指的是Cortex-A73。与Cortex-A73相比,它的性能差距不到10%,但性能优化可达35%,因此非常高效的。它适用于智能手机、家用设备和可穿戴设备。

关于向64位过渡

Arm的计划是预计到2023年,Arm在移动应用的大核跟小核都将仅支持64位。目前,Cortex-X2、Cortex-A510已经是64位CPU,A710仍然支持32位。Arm高管表示,目前我们正持续与中国的手机应用商店合作伙伴密切携手,来分阶段实现向64位的过渡。另外,我们今天所宣布的64位迁移只是针对拥有丰富用户体验的移动应用领域。

Armv9-A CPU群集(cluster)

Armv9-A CPU 群集(cluster)的支柱是新款的动态共享单元( DynamIQ Shared Unit)DSU-110,该组件可为不同的细分市场提供各种解决方案。DSU-110 具备可扩展性、可支持多达八个 Cortex-X2内核配置的出色性能、安全性和机器学习功能,同时还能确保效率表现。基于Armv9-A CPU cluster的设备将在2022年发布。

在cluster中,通过Cortex-X2,达到30%峰值性能的提升,带来更快速、旗舰的用户体验,Cortex-A710 将实现高达30%的能效提升,这将改善智能手机持续使用的场景性能,例如游戏。小核Cortex-A510,它将提供35%的性能提升,不仅有助于提升cluster中多核性能的表现,也会提高日常任务的效率,例如浏览社交媒体新内容或是邮件。

Arm Mali GPU连续五年,年出货量超过十亿

2020年Mali GPU出货超过十亿个,这是连续第五年Mali的年出货量超过十亿。数据显示,Mali GPU驱动着80%的电视、超过半数的智能手机。它提供了最佳的手游、新的AI技术和应用程序的体验,同时强化了家庭娱乐与增强现实技术应用。



具体来看,新款Arm Mali-G710是针对旗舰智能手机和不断增长的Chromebook笔记本市场所推出的高性能GPU,在计算密集型体验方面(如 AAA 高保真游戏)的性能提升20%。对于各种与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710也带来了 35%的机器学习性能提升。

次旗舰GPUArm Mali-G610继承了Mali-G710的所有功能,但价格更低。Arm Mali-G510实现了性能和效率的完美平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了100%的性能提升以及22%的节能优化 ,从而延长了电池续航时间,提升了100%的机器学习性能。

Arm Mali-G310是Arm最高效的GPU,以最小的面积成本提供了最高的性能。通过 Mali-G310, Valhall 架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR设备和可穿戴设备。

系统IP——CoreLink 700是全面计算的一部分

为了完善Armv9全面计算解决方案,也需要系统IP——CoreLink 700,它由基于大规模云计算部署互联技术的经验所构建,并针对CPU与GPU的需求量身打造。


它拥有Armv9的功能,例如内存标签扩展,它能带来改进的带宽和更短的时延,并为各档次的终端计算设备释放性能表现。

全面计算怎么理解?

Arm 全新的全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理 IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间。

全面计算解决方案也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持AI功能的交互式应用场景,可以使用户身临其境观看电视中丰富的8K内容。所有的这一切再加上安全技术作为基础,将为未来十年构建可信的数字化服务。

这些解决方案的核心是Arm的全新IP套件,包括首批 Armv9 Cortex CPU、具有出色图形功能的MaliGPU和全新的CoreLink系统IP。

当被问及目前Arm全面计算在哪些应用场景中拥有更高的接受度时,Arm高管表示,在终端领域,一部分是通过全面计算获得高性能的应用场景,比如游戏生态和拥有丰富人工智能功能的应用。还有一些是涉及安全功能的应用场景,如说安全交易、银行类的应用以及设备端个人数据保护等,Arm全面计算解决方案可以有效提升这些应用场景的安全性。还有,全面计算解决方案使我们生态系统中的所有软件开发者可以轻松地解锁最新设备上的性能。

提升游戏场景

以游戏为例,经测试的整个游戏内容中全面计算系统优化的结果显示,Cortex-A710 CPU在运行驱动工作负载时,带来了33%的性能提升;Mali-G710带来了20%的性能提升,系统级IP 提供了15%的效率提升。

以系统级满足AI多样化需求

Arm高管指出,如今AI的需求非常多样化,他们试图使用系统级方式满足全部的需求,全面计算解决文案很好地整合了Arm所有处理器所具有的强大AI功能。在不同的Arm IP上运行多样的AI工作负载带来不同的性能提升,例如Mali-G710平均35%的提升,Cortex-M55 高达700%的提升,注意这是针对能耗局限工作负载,例如关键字侦测等。



一般来说,以往的算力都会根据一些针对IP的系统运行标准进行衡量,而具体到全面计算解决方案,我们会根据现实世界的广泛用例进行衡量,例如,通过在Arm全面计算解决方案中使用系统级缓存功能,可以降低15%的系统能耗。

安全升级

安全是Armv9重要的功能之一,它过Armv9 技术引入到每一个设备中。例如Arm与谷歌共同开发的内存标签扩展等技术,它们能让开发者更易于辨识和预防内存安全问题。

在Arm成熟的TrustZone技术的基础上,安全的EL2能将TrustZone技术提升到新的水平,让独立安全的app相互隔离,减少黑客攻击。

小结:

Armv9架构是Arm十年来最大的升级,早前Arm已经表示它将是面向未来十年的计算基础。可以清晰地看到,此次面向终端设备发布的一系列产品,不仅在于提升处理器的性能,也在安全、人工智能方面融入了更多,这是Arm做为IP厂商以前瞻的眼光定义的未来,它以更灵活的方式满足终端设备的需求。

作者:黄晶晶 微信号:kittyhjj 欢迎交流!

本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

[ 新闻来源:电子发烧友网,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!