有关麒麟810和华为nova 5，有些事华为没告诉你-icspec

有关麒麟810和华为nova 5，有些事华为没告诉你

来源:EET 发布时间:2021-05-11

分享至微信

“因为夜的黑，光才被衬托得更美。”这话其实是用来形容华为nova 5系列手机的拍照能力的，不过在现如今这个国际环境大背景下，倒似更有深意了，也更符合华为现在的处境。华为消费业务手机产品线总裁何刚在华为nova 5系列产品发布会上，说出这句话的时候，发布会所在地的武汉还在下着小雨。

华为nova 5发布会的关键，除了易烊千玺和易烊千玺的粉丝们，就是海思麒麟810了。而AI又是麒麟810的重点，或者说华为nova 5手机的一切都是围绕着AI在进行的。而有关麒麟810的NPU——也就是AI核心部分，有些是华为在发布会上没告诉你的。

为什么7nm很重要？

华为nova 5和5 Pro两款手机的配置包括6.39英寸1080p OLED屏幕（覆盖108%的DCI-P3色域），后置四颗摄像头（1/2英寸4800万像素主摄，1600万像素广角摄像头，200万像素微距镜头，200万像素辅助深度计算摄像头），前置3200万像素摄像头，屏下指纹识别，支持NFC，支持40W功率快充（30分钟充85%的电），3500mAh电池，8GB RAM以及最高256GB存储容量。

两款手机不同之处就在于nova 5 Pro采用麒麟980 SoC，而nova 5为麒麟810。前者也就是先前华为P30/Mate 20这样的旗舰设备所用的SoC，而后者是首次问世——麒麟810是华为海思推出的第一个“8”系列SoC，也是本场发布会的真正主角。这样一来麒麟的7、8、9系列就补全了（实际上还有6系列）。从数字排位就不难发现，麒麟810是一颗定位中高端的移动SoC。

海思麒麟810的主要配置包括，7nm工艺制程，CPU部分8核设计：两个最高频率2.27GHz的Arm Cortex-A76核心，以及六个最高1.88GHz的Cortex-A55核心；GPU部分为定制的六核Mali-G52；NPU是华为自研的达芬奇架构；此外通信部分支持双VoLTE、双卡双待。

从CPU架构就不难发现，麒麟810的主要竞标对手是高通骁龙730。后者是高通在今年4月推出的一款SoC，其CPU部分就是两个2.2GHz的Kryo 470核心——基本相当于Cortex-A76小改款，外加六个频率更低的小核心。华为在2018年7月发布麒麟710之后，长时间没有针对这一档位更新SoC；尤其在高通去年10月发布骁龙675力压麒麟710之后，中高端移动SoC更新显得更加紧迫。

华为也毫不避讳地在发布会上就各组件的性能，直接将麒麟810和骁龙730进行了比较。虽然这个定位没法像麒麟980那样用到DynamiQ结构，但7nm工艺制程仍是是麒麟810引以为傲的一部分：主流的移动SoC制造商，几乎不会将最先进的工艺制程下放给旗舰SoC之外的产品，比如高通现如今也只有骁龙855采用7nm制程，而最新的骁龙730所用的是三星的8nm LPP工艺——其实际效果，以及从三星自家旗舰SoC的die size来看，8nm LPP还是比台积电的7nm差不少的。

高通早年的传统也一直是旗舰SoC用新工艺，次旗舰用上一代或过渡工艺。何刚也在发布会上特别说华为是全球第一个有两颗7nm芯片的厂商，这一点还是具备了很大意义的。在谷歌宣布停止与华为合作后，GMS服务的缺失会让华为手机在海外市场大为挫败。肯花血本在次旗舰SoC产品，大约是华为期望提振国内手机销量的某种表现：推动非旗舰产品在国内的销量，进一步攻占中低端手机市场，并保证中低端设备的体验，麒麟810设备必然是未来真正走量的产品，销量应该也理应远高于麒麟980。

所以就频率来看，麒麟810的CPU大核心只比骁龙730多了0.07GHz，小核心多0.08GHz，但华为宣称麒麟810单核性能较骁龙730高出11%，多核则高13%。7nm的制程红利应该是其中的最重要因素，毕竟更出色的工艺在提升性能密度的同时，也可提升能效、控制发热，并将热平衡转折点进一步推高。

定制GPU性能强于骁龙730？

原本GPU性能和能效一直是麒麟SoC的短板，从高端到中低端皆是如此。麒麟810的GPU部分为Arm Mali-G52核心，这是G51的换代产品，定位仍然是中端，在Mali家族也无法与Mali-G7x系列相提并论。从NoteBookCheck的数据看，Arm Mali-G51MP4（麒麟710）与Mali G72MP12（麒麟970）的性能差距可能超过150%。

实际上，我们很少看到有手机SoC采用Mali-G5x GPU，大概也就海思上一代麒麟710 SoC用的是Mali-G51MP4（G51比较奇特，G51包含uni-pixel和dual-pixel纹理单元，Arm当时是用像素吞吐来标注MP后面的数字，所以这里的MP4很可能不表示shader核心数，但G52已经修正了这一问题）。

来源：Arm

Mali G52在微架构上的提升还是比较大的，一个核心内一个执行引擎的ALU lane数量翻倍。在Bifrost架构中，每条ALU lane包含一个FMA和一个ADD/SF计算单元；原本每个执行引擎由4个这样的lane构成，组成一个wavefront，G52则将这个数字提升到了8个——这种转变其实颇有点儿G77 Valhall的意思。Arm宣称，Mali G52的性能密度提升30%，也就是每平方毫米的fps帧率提升30%——这个程度的提升至少在Mali G7x面前还是有量级差距的。可以说华为nova 5和nova 5 Pro的图形处理性能会有很大差距。

但要跟Adreno对比，就比较麻烦了。高通骁龙Adreno GPU在架构上完全是个黑匣子，也就无法做出理论对比。好在NoteBookCheck曾对比过Mali G51MP4和Adreno 616的性能，这让Mali G52和Adreno 618的对比有了点儿依据。从NoteBookCheck的数据来看，Mali G51MP4比Adreno 616要弱40%左右，这还是个不小的差距。

数据来源：NoteBookCheck

高通宣称，Adreno 618相比616在性能方面提升了25%。那么基于Mali G52的性能密度提升30%，麒麟810在GPU方面的绝对性能要超越骁龙730，难度感觉还是有点大的。但华为提到这是“定制的”Mali G52，shader核心数量为6，而Arm官方推荐的是1-4个核心，性能的理论情况就变得比较复杂了。

另外不要忘记，发布会上提到了GPU的负载优化技术Gaming+。何刚只说这种技术更底层，是“GPU底层驱动升级”，以及AI调频调度——提到AI，它听起来就和GPU Turbo很像了。早前有种技术通过硬件计数器监听GPU利用率，调整DVFS，这种技术是不及GPU Turbo精度高的——GPU Turbo配合了渲染管线，对于未来帧的预测比之更细粒度。我们猜测Gaming+可能融合了这种更被动和低精度管线的机制。

发布会上何刚呈现了游戏《崩坏3》的帧率成绩。《崩坏3》以往一直都是比较吃GPU渲染能力的游戏。从华为官方的数据来看，麒麟810玩这款游戏时，帧率基本稳定在60fps，而骁龙730则在40fps上下剧烈震荡，有时可能掉到30fps以下。这很大程度可能是Gaming+和GPU Turbo的功劳。

GPU Turbo的本质就是采用神经网络，针对每款设备、每款游戏的DVFS动态电压频率调整优化控制。这是一种典型利用深度学习的技术，在应用和GPU驱动之间设一个监听层，监听渲染调用，试图找到游戏每个时刻硬件资源最佳利用的甜蜜点。不过其缺陷就在于，针对每款游戏都需要事先在云端进行training，然后通过固件推到手机端，在手机端通过NPU来inferencing。

至于华为宣称GFXBench霸王龙和曼哈顿常规测试项测试成绩，麒麟810较骁龙730分别有15%和44%的领先，就让人感觉有些惊讶了，可能是核心数超Arm官方预期所致，这就让我们非常好奇这颗GPU的能效比情况如何——毕竟Arm提到Mali G52的能效比提升仅15%。

所以麒麟810的这颗GPU未来还是很值得研究的，至少华为没有按照Arm公版套路来，就定制和改动这件事，华为看来的确是预备在GPU方面发力的。未来的麒麟SoC，GPU部分可能会出现更有趣的变化。定制的G52很可能只是个开始。

麒麟810的AI性能比980还强？

华为在AI，或者神经网络的应用上真可谓十分激进，GPU Turbo这种技术就是个例子。这次麒麟810也有AI专核，也就是NPU了，早前的麒麟710是没有的。更重要的是，这次的NPU是华为自研的达芬奇架构，而不再是寒武纪的NPU。这原本也是顺理成章的，去年10月，华为就发布了两款名为昇腾的AI芯片，当时就提到“全新自研Da Vinci计算架构”，也就是达芬奇，不过它们并不应用于手机。昇腾310在宣传中就提到集成张量、矢量、标量等多重计算单元。

实际上，NPU在AI或者叫卷积神经网络中扮演着本地推测（inferencing）的角色。AI神经网络工作分成两部分，其一是模型训练（training），这个类型的工作量极大，且精度要求高，得是服务器才行，比如谷歌TPU就干这个——GPU Turbo的游戏模型训练就是这部分工作；其二就是模型推测——它对性能要求低很多，精度也更低，也就能放到本地来执行了。

高通在这方面的思路一直是，通过DSP、GPU来完成inferencing工作，而没有必要做个专门的硬件单元，包括骁龙855实际上都是依靠多个现有单元联合实现AI运算（不过骁龙855的DSP内部多加了张量加速器）。高通在启动AI SDK方面的工作也是比较早的。GPU和DSP在执行这种重度并行工作时相比CPU的确有优势，所以Arm推的Mali GPU架构都在宣传机器学习ML inferencing性能，包括麒麟810这次用的Mali G52，Arm也特别提升了其ML性能——虽然在麒麟810中，这部分能力大概也不会发挥多少。

而华为、苹果则认为，DSP和GPU是不够的，尤其在张量立体化运算方面。所以AI专核NPU就诞生了。就这个角度来说，麒麟810的AI跑分数据超越骁龙730其实是理所应当的，超越骁龙855则让人比较惊讶了——毕竟骁龙855的DSP在张量计算方面也相当出色。要知道，就苏黎世联邦理工学院的AI Benchmark来看，骁龙855的AI跑分成绩实际是优于麒麟980的。

发布会上，何刚并没有对比麒麟810和麒麟980的NPU算力成绩。如果何刚公布的这个排名属实，那么麒麟810的AI性能实际是优于华为自家旗舰麒麟980的。为此，我们去AI Benchmark官网查看了目前的跑分排名数据，单就手机设备的成绩来看，与华为在发布会上给的数据基本一致——不过这个成绩实际考察的是设备的综合AI性能，比如还关乎存储性能，而且还涉及到设备的某些配置模式，例如nova 5有高性能模式。

数据来源：AI-Bench

但即便只看处理器本身，这个排名其实依然是不变的，且麒麟810的确是比本家的980还要强悍。这里尤为值得一提的是，AI Benchmark主要针对的是Android的NNAPI，而非SoC制造商自家的SDK工具和API（比如海思的HiAI API，高通的SNPE SDK）。

而NNAPI是需要华为、高通这样的SoC制造商底层驱动给予支持的，如果说它们未能支持NNAPI，则计算任务就会转给CPU，那么效率就会低下很多了。比如高通855的张量加速器模块，在Android Q之前就没有支持NNAPI。所以AI基准测试实际也有待进一步完善，或者说手机AI专核目前的发展程度还比较初级，未来正要迎来一波爆发。

这么强的AI性能，是噱头吗？

有这么强悍的NPU，又能用来做什么呢？前面提到GPU玩儿《崩坏3》满帧是个例子。NPU实际上还可以帮助CPU和存储更快地通讯、预测GPU负载过高及时调整、追踪手机运行帧率、流畅度和触控输入的实时变化，来进一步提升手机的使用体验。还有一些则是华为在本次发布会上提到的各种细枝末节，包含了：

- AI提升4800万像素的解析力
- AI视频拍摄防抖
- AI视频与照片HDR
- AI让身材秒变大长腿
- AI电影留色
- AI智慧视频剪辑
- AI语音助手小艺
- AI美音

尤其是最后一项“AI美音”，实际就是用KTV软件唱个歌，手机智能修音，优化唱歌节奏和音准，就算你唱歌很差也能拯救。现场演示时，所有观众都自发赞叹和鼓掌，可见这还是个刚需。就前面这些列出的AI应用，不难发现目前AI的应用还集中在在视觉AI，比如拍照、拍视频。

歌声不动听？AI能自动后期！（此处有欢呼声）

它们听起来好像都不够高大上。但AI在computational photography领域的应用原本就是悄无声息的。举个简单的例子，谷歌针对拍照、拍视频一直都在进行机器学习研究。比如针对视频拍摄的防抖，除了利用陀螺仪、光学防抖传感器来获取视频拍摄时的动态源数据，随后对动态画面进行剪切，当场景本身很复杂包含大量深度层级的时候，视觉的AI分析就能极大地减少处理痕迹。现在拍视频越来越稳，实际就有AI的功劳。这应该和华为的AI视频拍摄防抖比较类似。

何刚在发布会上特别对比了华为nova 5拍照的细节胜于竞品。他说同样是4800万像素的图像传感器，且型号一致，但AI能给出更多的细节。我们猜测nova 5的这颗图像传感器应该是来自索尼的IMX586——这也是很多手机在用的一颗CIS。而细节更多，本质上更像是“AI拍月亮”的延续，或者结合了ISP做多张堆栈。另外还有拍摄视频时，仅有画面主体人物保留色彩，周围都是黑白的；在夜晚自拍时，即便逆光，通过识别拍摄主体、剥离拍摄主体，结合多张堆栈实现高动态HDR…这些都是典型的深度学习应用场景了。

主播们的福音：秒变大长腿，毫无PS痕迹

借用AI，实现前置摄像头的夜间HDR

AI其实是在悄无声息间解决一些体验痛点

一直以来不都是隐于生活，并令其成为生活习惯的组成部分，才是最好的科技吗？这是现如今AI在悄无声息改变生活方式的一种表达，就是让手机使用的体验变得更好，在悄无声息间变得更好。而AI实际的发展领域可能还非常多，GPU Turbo之类只是冰山一角。例如谷歌前两年畅想的，将深度学习应用于软件、系统的不同层级，比如放到编译器层级，实现高级语言编译的最优化，让程序运行更流畅，让上层和底层硬件的默契更好；甚至应用到华为的方舟编译器，更进一步提升runtime的效率。

这是华为AI布局的前瞻，实际也是现如今麒麟手机SoC走在前列的核心，和华为手机差异化竞争的关键所在。包括拍照好，现如今都需要NPU的参与。如此舍得在3000元这个价位的手机产品（nova 5/2799元；nova 5 pro/2999元起）中放进如此算力的NPU，也表明将AI专核、edge AI普及到智能手机中，华为跨的步子最大，亦将是推动华为手机销量的主要组成部分。