年前我们做了个Intel Arc显卡的体验视频,谈到了Arc GPU当前存在的问题,及其相比于同档竞品如何。有兴趣的同学可以前往关注电子工程专辑的微信视频号做了解。 在视频中,我们提到了Intel独显目前最欠缺的是高效的生态,包括完善的驱动程序——尤其是对于所用API版本 包括去年12月份的一次更新,Intel说能够让Arc A750/A770在部分DirectX 9游戏里提升将近1.8倍的帧率——这不就约等于买了张新显卡吗。我们自己的体验则明确感知到了,Intel这几个月的时间在马不停蹄地修复各种前期存在的驱动bug,并做更多图形渲染与效率的优化。 在大约半年前Arc显卡刚上市的时候,Intel院士(Fellow)Tom Peterson就提到过,Intel在驱动程序的GPU效率利用方面还有非常大的提升空间。去年我们也撰文谈到过,Arc A770/A750显卡上面的那颗die,晶体管数量实际上是多于英伟达GeForce RTX 3070/3070 Ti显卡上的die的。 虽然晶体管数量并不能表现显卡的实际性能和效率,但这说明Arc A770堆料很充分,而且成本还不低,却只能卖着比GeForce RTX 3060还便宜的价格,起初在不少老游戏上性能表现还不及后者(虽然DirectX 12和Vulkan游戏性能还不错)。这也是Intel显卡初期口碑并不好的原因。 不过昨天Intel专门召开了一场媒体沟通会,就只宣布一件事:我们又更新了一版驱动,叫Q1'23 Arc Update——2月1日提供下载。在大方向上,Intel宣称这次的驱动更新,让Arc GPU在较老的DirectX 9游戏上平均实现了43%的性能提升(相比于显卡发布时最初版本的驱动);若以游戏全程最低帧率的1%来看,则提高了60%;以及Intel头一次相对有底气地说了句,按照性价比来算(fps/$,也就是每1美元能够获得的游戏帧率),Arc A750相比于英伟达GeForce RTX 3060平均高出52%。 期间Tom Peterson也接受了采访。我们来看看这次驱动更新的与众不同之处。 有关老游戏的性能提升 如文首所述,其实去年12月份Arc GPU驱动更新就已经提到了像《CS:GO》这种DirectX 9游戏的帧率有了大幅提升。不过Tom Peterson在接受采访时说,当时的更新只针对一小部分游戏做了优化,而这次的Q1'23 Arc Update则扩大了范围。他强调说,此次更新针对目前的Arc全线GPU,包括Arc A380、A750、A770等,以及面向笔记本的移动版Arc GPU。 新版驱动能够明确产生性能飞跃的,是DirectX 9 API的执行效率,而DirectX 11、12游戏也都有对应的性能提升。Tom Peterson在媒体沟通会上多次提到,建议大家下载新的驱动,重新体验一下不同游戏的性能变化。感觉Intel能为一个驱动更新,专门开一场媒体发布会,大约也能掂量本次驱动更新对于Arc GPU的重要性。 比较具有代表性的游戏仍然是《CS:GO》,据说在更新完这次的4086驱动以后,游戏帧率能够从最初3490驱动版本的195fps,提升到347fps——说的应该是Intel公版的Arc A750 Limited Edition 8GB以1080p分辨率进行的测试。其他DirectX 9游戏的性能提升具体如上图。 Intel的第一方测试里,提升幅度较小的《激战2(Guild Wars 2)》和《为了吾王(for the King)》有大约10%的性能提升;而《半条命2(Half-Life 2)》《群星(Stellaris)》《上古卷轴5:天际(The Elder Scrolls V: Skyrim)》这些游戏都有超过70%的性能提升。 另外Tom Peterson还特别谈到了帧生成时间(frametimes)。以《CS:GO》为例,Tom Peterson说最初版本的驱动,frame time是很不稳定的,有时候快、有时候慢,帧生成时间的抖动会造成不良的游戏体验。而新版驱动也在这方面有了显著提升,实际游戏体验也会更流畅。 而另一个衡量体验流畅性的、很多玩家看重的最低1%平均帧(99th percentile),新版驱动则在某些游戏里做到了超过2倍的性能提升,具体如上图。Intel说从最低1%平均帧的角度来看,不同游戏平均有60%的体验提升。 新游戏和性能挖掘的可能性 这次分享会上,Intel主要分享的就是DirectX 9老游戏性能提升。而DirectX 11和DirectX 12,Intel提得不多。其实如我们此前的测试,因为Intel早期就原生针对DirectX 12 API做优化,所以新游戏的效率表现原本就还算理想;至于DirectX 11,Intel这次提到了《星际战甲(Warframe)》:最初Arc A750玩这款游戏的帧率是159fps,而新版驱动更新后则能达到250fps。 Intel官方驱动更新页面应该会有更多针对不同游戏的性能提升数据公布,关注Arc GPU的同学可以去看一看有没有自己关心的游戏。不过对于各版本API的优化,理论上应该能促成采用该API的不同游戏的性能提升,虽然提升幅度是个未知数。 另外,这次Intel还特别给出了Arc A750以1080p分辨率玩一众游戏,当前版本驱动(Q1'23 Arc Update)所能达到的性价比(fps/$,每1美元能够获得的游戏性能)与GeForce RTX 3060 12GB(528.02驱动)之间的对比,具体如上图所示(2月1日起,Arc A750 Limited Edition 8GB售价下调到了249美元)。这张表涵盖了DirectX 9、11、12的不同游戏。 Tom Peterson特别提到:“以前DirectX 9是我们的弱势项,但现在已经成为我们的长项了。”似乎某些游戏有2倍的性价比优势(《Rift》《银河破裂者(The Riftbreaker)》《无主之地3(Borderland 3)》。 Intel说,总体相比RTX 3060有52%的性价比领先。这类一方数据可能会有一定的倾向性。具体更多的游戏性能和性价比对比,还是可以等一等媒体三方的测试数据。不过这次Intel信心这么充足,表明在新驱动上应该是下了不少工夫的。 基于前文谈到Arc 750/770的这片die(ACM-G10)晶体管用料,Intel仍然没有将其与GeForce RTX 3070作比,而且价格明显比3070更低,现阶段还是有少赚钱、赚吆喝的成分在。Tom Peterson说,未来的驱动更新还会进一步推升Arc GPU的性能,但Intel正“接近显卡所能释放的性能潜力(we're getting closer to unleash the potential of the graphics card that we've built off the chip that we've built)”,未来不大可能会有像这次更新这样成倍的性能提升。 在答记者问阶段,Tom Peterson也提到:“毫无疑问显卡的性能将会有大幅提升,但我预计不会达到RTX 3070的程度。”我们猜测Chips and Cheese在此前microbenchmarking测试文章里提到的GPU硬件架构层面存储级并行能力的缺失,可能的确还是存在的。 据说重做了驱动架构 另外值得一提的是,我们此前针对Arc GPU的体验就指出过,可能由于Xe核心存储并行能力存在短板,在低占用、低并行的情况下,Arc GPU的性能会难以发挥。表现在游戏里,可能是更高分辨率下,Arc GPU的表现会更理想(换句话说,更低分辨率的表现会不及预期)。 这次Intel也给出了2k分辨率(2560x1440)下,Arc A750在驱动更新过后的游戏性能提升,如上图所示。提升幅度的确还是比1080p分辨率下更大的,如《群星(Stellaris)》游戏中的平均帧提升达到了87%;《CS:GO》在1440p分辨率下最低1%帧数甚至有高达123%的提升。这对现阶段的Arc GPU而言其实不算什么好事。我们也特别就这个问题询问了Tom Peterson。他是这么回答的:“我这里目前没有这方面的技术细节,不过我可以谈谈我的想法(intuition)。以前的Arc驱动对CPU负载比较敏感(Arc drivers in the past have been particularly CPU-heavy)。如果你去对比一下Arc和英伟达驱动的CPU负载,会发现Arc驱动在这方面需要做更多的事情。” “也就是说在更低分辨率下,会有更高的CPU负载需求,更加受到CPU工作的限制(you're kind of limited by how much work your CPU can do to drive graphics)。而随着分辨率的提升,平衡会发生偏移,GPU会干更多的活儿,CPU所占比重更低。我觉得这是主要原因。”Tom Peterson说,“所以我们会看到更少的CPU瓶颈,更接近Arc GPU能够达成的潜力(So we're seeing less CPU kind of blockage, and you're getting closer to the potential of the Arc GPU)。” “这一点也同样发生在我们最新的驱动上,你在不同的API上应该都会发现这样的趋势。所有的API上,更高分辨率下会达成更高的性能扩展水平(you'll see more scaling at higher resolution across all APIs)。” 除此之外,我们也很好奇Intel对驱动具体做了什么,达成如此程度的性能提升。因为我们也在以往的文章里解释过,起先Arc并不能对DirectX 9游戏做原生支持,而是借助微软的D3D9on12这个中间层的转译来实现老游戏的兼容,则过去《CS:GO》这样的老游戏在Arc上跑就会表现出显著的性能折损。 从Tom Peterson的解释来看,新驱动可能已经抛弃了这种做法。“3490驱动上,CS:GO跑到195fps,而且存在抖动问题,这和我们此前针对DX9驱动的架构策略有关。”“这次的大幅提升,是因为我们对驱动进行了重构(re-architect)。重构后的驱动不仅对一部分游戏有效,而是对绝大部分DX9游戏都有价值。”不过他没有解释Intel具体是怎么做的。(It's now much more optimized directly by Intel. And that's producing better results that we can quickly iterate) Intel游戏显卡生态近半年的提升应该说还是有目共睹的——虽说期间伴随着各种质疑,但借着其GPU部门的疯狂加班(不是),从最早bug一堆到现如今效率逐渐提高,及近两个月的效率大跨步,都让Intel游戏显卡业务逐步走上正轨。 其实也不止于此,目前支持Intel XeSS超分特性的游戏也已经达到了35款,生态扩展速度比当初英伟达做DLSS的时候更快——虽说就其开发方式来看,多少也算是站在了巨人的肩膀上,但Intel做图形渲染GPU的决心看起来还是比以往要更为坚定的。 END