“因为夜的黑,光才被衬托得更美。”这话其实是用来形容华为nova 5系列手机的拍照能力的,不过在现如今这个国际环境大背景下,倒似更有深意了,也更符合华为现在的处境。华为消费业务手机产品线总裁何刚在华为nova 5系列产品发布会上,说出这句话的时候,发布会所在地的武汉还在下着小雨。
华为nova 5发布会的关键,除了易烊千玺和易烊千玺的粉丝们,就是海思麒麟810了。而AI又是麒麟810的重点,或者说华为nova 5手机的一切都是围绕着AI在进行的。而有关麒麟810的NPU——也就是AI核心部分,有些是华为在发布会上没告诉你的。
为什么7nm很重要?
华为nova 5和5 Pro两款手机的配置包括6.39英寸1080p OLED屏幕(覆盖108%的DCI-P3色域),后置四颗摄像头(1/2英寸4800万像素主摄,1600万像素广角摄像头,200万像素微距镜头,200万像素辅助深度计算摄像头),前置3200万像素摄像头,屏下指纹识别,支持NFC,支持40W功率快充(30分钟充85%的电),3500mAh电池,8GB RAM以及最高256GB存储容量。
两款手机不同之处就在于nova 5 Pro采用麒麟980 SoC,而nova 5为麒麟810。前者也就是先前华为P30/Mate 20这样的旗舰设备所用的SoC,而后者是首次问世——麒麟810是华为海思推出的第一个“8”系列SoC,也是本场发布会的真正主角。这样一来麒麟的7、8、9系列就补全了(实际上还有6系列)。从数字排位就不难发现,麒麟810是一颗定位中高端的移动SoC。
海思麒麟810的主要配置包括,7nm工艺制程,CPU部分8核设计:两个最高频率2.27GHz的Arm Cortex-A76核心,以及六个最高1.88GHz的Cortex-A55核心;GPU部分为定制的六核Mali-G52;NPU是华为自研的达芬奇架构;此外通信部分支持双VoLTE、双卡双待。
从CPU架构就不难发现,麒麟810的主要竞标对手是高通骁龙730。后者是高通在今年4月推出的一款SoC,其CPU部分就是两个2.2GHz的Kryo 470核心——基本相当于Cortex-A76小改款,外加六个频率更低的小核心。华为在2018年7月发布麒麟710之后,长时间没有针对这一档位更新SoC;尤其在高通去年10月发布骁龙675力压麒麟710之后,中高端移动SoC更新显得更加紧迫。
华为也毫不避讳地在发布会上就各组件的性能,直接将麒麟810和骁龙730进行了比较。虽然这个定位没法像麒麟980那样用到DynamiQ结构,但7nm工艺制程仍是是麒麟810引以为傲的一部分:主流的移动SoC制造商,几乎不会将最先进的工艺制程下放给旗舰SoC之外的产品,比如高通现如今也只有骁龙855采用7nm制程,而最新的骁龙730所用的是三星的8nm LPP工艺——其实际效果,以及从三星自家旗舰SoC的die size来看,8nm LPP还是比台积电的7nm差不少的。
高通早年的传统也一直是旗舰SoC用新工艺,次旗舰用上一代或过渡工艺。何刚也在发布会上特别说华为是全球第一个有两颗7nm芯片的厂商,这一点还是具备了很大意义的。在谷歌宣布停止与华为合作后,GMS服务的缺失会让华为手机在海外市场大为挫败。肯花血本在次旗舰SoC产品,大约是华为期望提振国内手机销量的某种表现:推动非旗舰产品在国内的销量,进一步攻占中低端手机市场,并保证中低端设备的体验,麒麟810设备必然是未来真正走量的产品,销量应该也理应远高于麒麟980。
所以就频率来看,麒麟810的CPU大核心只比骁龙730多了0.07GHz,小核心多0.08GHz,但华为宣称麒麟810单核性能较骁龙730高出11%,多核则高13%。7nm的制程红利应该是其中的最重要因素,毕竟更出色的工艺在提升性能密度的同时,也可提升能效、控制发热,并将热平衡转折点进一步推高。
定制GPU性能强于骁龙730?
原本GPU性能和能效一直是麒麟SoC的短板,从高端到中低端皆是如此。麒麟810的GPU部分为Arm Mali-G52核心,这是G51的换代产品,定位仍然是中端,在Mali家族也无法与Mali-G7x系列相提并论。从NoteBookCheck的数据看,Arm Mali-G51MP4(麒麟710)与Mali G72MP12(麒麟970)的性能差距可能超过150%。
实际上,我们很少看到有手机SoC采用Mali-G5x GPU,大概也就海思上一代麒麟710 SoC用的是Mali-G51MP4(G51比较奇特,G51包含uni-pixel和dual-pixel纹理单元,Arm当时是用像素吞吐来标注MP后面的数字,所以这里的MP4很可能不表示shader核心数,但G52已经修正了这一问题)。
Mali G52在微架构上的提升还是比较大的,一个核心内一个执行引擎的ALU lane数量翻倍。在Bifrost架构中,每条ALU lane包含一个FMA和一个ADD/SF计算单元;原本每个执行引擎由4个这样的lane构成,组成一个wavefront,G52则将这个数字提升到了8个——这种转变其实颇有点儿G77 Valhall的意思。Arm宣称,Mali G52的性能密度提升30%,也就是每平方毫米的fps帧率提升30%——这个程度的提升至少在Mali G7x面前还是有量级差距的。可以说华为nova 5和nova 5 Pro的图形处理性能会有很大差距。
但要跟Adreno对比,就比较麻烦了。高通骁龙Adreno GPU在架构上完全是个黑匣子,也就无法做出理论对比。好在NoteBookCheck曾对比过Mali G51MP4和Adreno 616的性能,这让Mali G52和Adreno 618的对比有了点儿依据。从NoteBookCheck的数据来看,Mali G51MP4比Adreno 616要弱40%左右,这还是个不小的差距。
高通宣称,Adreno 618相比616在性能方面提升了25%。那么基于Mali G52的性能密度提升30%,麒麟810在GPU方面的绝对性能要超越骁龙730,难度感觉还是有点大的。但华为提到这是“定制的”Mali G52,shader核心数量为6,而Arm官方推荐的是1-4个核心,性能的理论情况就变得比较复杂了。
另外不要忘记,发布会上提到了GPU的负载优化技术Gaming+。何刚只说这种技术更底层,是“GPU底层驱动升级”,以及AI调频调度——提到AI,它听起来就和GPU Turbo很像了。早前有种技术通过硬件计数器监听GPU利用率,调整DVFS,这种技术是不及GPU Turbo精度高的——GPU Turbo配合了渲染管线,对于未来帧的预测比之更细粒度。我们猜测Gaming+可能融合了这种更被动和低精度管线的机制。
发布会上何刚呈现了游戏《崩坏3》的帧率成绩。《崩坏3》以往一直都是比较吃GPU渲染能力的游戏。从华为官方的数据来看,麒麟810玩这款游戏时,帧率基本稳定在60fps,而骁龙730则在40fps上下剧烈震荡,有时可能掉到30fps以下。这很大程度可能是Gaming+和GPU Turbo的功劳。
GPU Turbo的本质就是采用神经网络,针对每款设备、每款游戏的DVFS动态电压频率调整优化控制。这是一种典型利用深度学习的技术,在应用和GPU驱动之间设一个监听层,监听渲染调用,试图找到游戏每个时刻硬件资源最佳利用的甜蜜点。不过其缺陷就在于,针对每款游戏都需要事先在云端进行training,然后通过固件推到手机端,在手机端通过NPU来inferencing。
至于华为宣称GFXBench霸王龙和曼哈顿常规测试项测试成绩,麒麟810较骁龙730分别有15%和44%的领先,就让人感觉有些惊讶了,可能是核心数超Arm官方预期所致,这就让我们非常好奇这颗GPU的能效比情况如何——毕竟Arm提到Mali G52的能效比提升仅15%。
所以麒麟810的这颗GPU未来还是很值得研究的,至少华为没有按照Arm公版套路来,就定制和改动这件事,华为看来的确是预备在GPU方面发力的。未来的麒麟SoC,GPU部分可能会出现更有趣的变化。定制的G52很可能只是个开始。
麒麟810的AI性能比980还强?
华为在AI,或者神经网络的应用上真可谓十分激进,GPU Turbo这种技术就是个例子。这次麒麟810也有AI专核,也就是NPU了,早前的麒麟710是没有的。更重要的是,这次的NPU是华为自研的达芬奇架构,而不再是寒武纪的NPU。这原本也是顺理成章的,去年10月,华为就发布了两款名为昇腾的AI芯片,当时就提到“全新自研Da Vinci计算架构”,也就是达芬奇,不过它们并不应用于手机。昇腾310在宣传中就提到集成张量、矢量、标量等多重计算单元。
实际上,NPU在AI或者叫卷积神经网络中扮演着本地推测(inferencing)的角色。AI神经网络工作分成两部分,其一是模型训练(training),这个类型的工作量极大,且精度要求高,得是服务器才行,比如谷歌TPU就干这个——GPU Turbo的游戏模型训练就是这部分工作;其二就是模型推测——它对性能要求低很多,精度也更低,也就能放到本地来执行了。
高通在这方面的思路一直是,通过DSP、GPU来完成inferencing工作,而没有必要做个专门的硬件单元,包括骁龙855实际上都是依靠多个现有单元联合实现AI运算(不过骁龙855的DSP内部多加了张量加速器)。高通在启动AI SDK方面的工作也是比较早的。GPU和DSP在执行这种重度并行工作时相比CPU的确有优势,所以Arm推的Mali GPU架构都在宣传机器学习ML inferencing性能,包括麒麟810这次用的Mali G52,Arm也特别提升了其ML性能——虽然在麒麟810中,这部分能力大概也不会发挥多少。
而华为、苹果则认为,DSP和GPU是不够的,尤其在张量立体化运算方面。所以AI专核NPU就诞生了。就这个角度来说,麒麟810的AI跑分数据超越骁龙730其实是理所应当的,超越骁龙855则让人比较惊讶了——毕竟骁龙855的DSP在张量计算方面也相当出色。要知道,就苏黎世联邦理工学院的AI Benchmark来看,骁龙855的AI跑分成绩实际是优于麒麟980的。
发布会上,何刚并没有对比麒麟810和麒麟980的NPU算力成绩。如果何刚公布的这个排名属实,那么麒麟810的AI性能实际是优于华为自家旗舰麒麟980的。为此,我们去AI Benchmark官网查看了目前的跑分排名数据,单就手机设备的成绩来看,与华为在发布会上给的数据基本一致——不过这个成绩实际考察的是设备的综合AI性能,比如还关乎存储性能,而且还涉及到设备的某些配置模式,例如nova 5有高性能模式。
但即便只看处理器本身,这个排名其实依然是不变的,且麒麟810的确是比本家的980还要强悍。这里尤为值得一提的是,AI Benchmark主要针对的是Android的NNAPI,而非SoC制造商自家的SDK工具和API(比如海思的HiAI API,高通的SNPE SDK)。
而NNAPI是需要华为、高通这样的SoC制造商底层驱动给予支持的,如果说它们未能支持NNAPI,则计算任务就会转给CPU,那么效率就会低下很多了。比如高通855的张量加速器模块,在Android Q之前就没有支持NNAPI。所以AI基准测试实际也有待进一步完善,或者说手机AI专核目前的发展程度还比较初级,未来正要迎来一波爆发。
这么强的AI性能,是噱头吗?
有这么强悍的NPU,又能用来做什么呢?前面提到GPU玩儿《崩坏3》满帧是个例子。NPU实际上还可以帮助CPU和存储更快地通讯、预测GPU负载过高及时调整、追踪手机运行帧率、流畅度和触控输入的实时变化,来进一步提升手机的使用体验。还有一些则是华为在本次发布会上提到的各种细枝末节,包含了:
- AI提升4800万像素的解析力
- AI视频拍摄防抖
- AI视频与照片HDR
- AI让身材秒变大长腿
- AI电影留色
- AI智慧视频剪辑
- AI语音助手小艺
- AI美音
尤其是最后一项“AI美音”,实际就是用KTV软件唱个歌,手机智能修音,优化唱歌节奏和音准,就算你唱歌很差也能拯救。现场演示时,所有观众都自发赞叹和鼓掌,可见这还是个刚需。就前面这些列出的AI应用,不难发现目前AI的应用还集中在在视觉AI,比如拍照、拍视频。
它们听起来好像都不够高大上。但AI在computational photography领域的应用原本就是悄无声息的。举个简单的例子,谷歌针对拍照、拍视频一直都在进行机器学习研究。比如针对视频拍摄的防抖,除了利用陀螺仪、光学防抖传感器来获取视频拍摄时的动态源数据,随后对动态画面进行剪切,当场景本身很复杂包含大量深度层级的时候,视觉的AI分析就能极大地减少处理痕迹。现在拍视频越来越稳,实际就有AI的功劳。这应该和华为的AI视频拍摄防抖比较类似。
何刚在发布会上特别对比了华为nova 5拍照的细节胜于竞品。他说同样是4800万像素的图像传感器,且型号一致,但AI能给出更多的细节。我们猜测nova 5的这颗图像传感器应该是来自索尼的IMX586——这也是很多手机在用的一颗CIS。而细节更多,本质上更像是“AI拍月亮”的延续,或者结合了ISP做多张堆栈。另外还有拍摄视频时,仅有画面主体人物保留色彩,周围都是黑白的;在夜晚自拍时,即便逆光,通过识别拍摄主体、剥离拍摄主体,结合多张堆栈实现高动态HDR…这些都是典型的深度学习应用场景了。
一直以来不都是隐于生活,并令其成为生活习惯的组成部分,才是最好的科技吗?这是现如今AI在悄无声息改变生活方式的一种表达,就是让手机使用的体验变得更好,在悄无声息间变得更好。而AI实际的发展领域可能还非常多,GPU Turbo之类只是冰山一角。例如谷歌前两年畅想的,将深度学习应用于软件、系统的不同层级,比如放到编译器层级,实现高级语言编译的最优化,让程序运行更流畅,让上层和底层硬件的默契更好;甚至应用到华为的方舟编译器,更进一步提升runtime的效率。
这是华为AI布局的前瞻,实际也是现如今麒麟手机SoC走在前列的核心,和华为手机差异化竞争的关键所在。包括拍照好,现如今都需要NPU的参与。如此舍得在3000元这个价位的手机产品(nova 5/2799元;nova 5 pro/2999元起)中放进如此算力的NPU,也表明将AI专核、edge AI普及到智能手机中,华为跨的步子最大,亦将是推动华为手机销量的主要组成部分。
发布会更多花絮:
本场发布会主体色始终为绿色
nova 5背面的纹理工艺又有特别处理
nova 5四摄,主摄、广角、微距、深度计算辅助
发布会上展示的平板产品M6,同样采用麒麟980
nova 5的特色之一是内置NFC芯片,华为特别与一些跑步机厂商合作,和跑步机碰一下就连接,并呈现运动数据
现场正在自拍的小姐姐
发布会的汹涌人潮
发布会的大量观众都是专程来看易烊千玺的
易烊千玺登场
这是华为第一次走进武汉召开发布会
华为消费业务手机产品线总裁何刚
除了nova 5/5 Pro之外,本次发布会还发布了10.8和8.4英寸的平板M6,nova 5i手机,华为mini蓝牙音箱,以及一些多彩配件产品
暂无评论哦,快来评论一下吧!