广告

天玑9000性能剖析:顺便跟iPhone芯片比比

2021-11-22 09:38:57 黄烨锋 阅读:
在这个时间节点下,联发科要在手机芯片方面持续保持增长,并进入更多用户主流视野的关键,应当是抓住机会顺势塑造更高端的品牌形象,并逐步吞噬原本是其弱项的高端手机市场。这一点其实并不容易做到。天玑9000是这一历史背景下的产品,联发科对其应当是寄予了相当的厚望的。这从本次联发科在发布会上几名高层的发言;以及针对天玑9000的某些硬件模块做了重新设计,和率先采用台积电4nm工艺都能看得出来……

这次Dimensity 9000芯片(以下称为天玑9000)发布会感觉挺特别。似乎联发科技(MediaTek,以下简称联发科)面向全球媒体,为一颗芯片召开前瞻性的线上+线下同时的发布会,在历史上是不多见的。这颗天玑9000手机芯片是明年(可能在明年Q1末之际正式上市)才会面世的产品。VNSednc

联发科总裁Joe Chen在会上给出的数据是,2021年联发科在智能手机SoC市场份额超过了40%——这份数据来自Counterpoint Research,也是我们最常引用、且认为比较可信的一个数据源。VNSednc

VNSednc

联发科这几年的营收连续增长并不是什么稀奇事,尤其在近一年多缺芯潮大环境下,对供应链具备前瞻性的管理能力是其持续吃下原属于高通市场的关键所在。在我们看来,缺芯潮似乎是联发科本身的一次重要机遇。VNSednc

在这个时间节点下,联发科要在手机芯片方面持续保持增长,并进入更多用户主流视野的关键,应当是抓住机会顺势塑造更高端的品牌形象,并逐步吞噬原本是其弱项的高端手机市场。这一点其实并不容易做到。天玑9000是这一历史背景下的产品,联发科对其应当是寄予了相当的厚望的。这从本次联发科在发布会上几名高层的发言;以及针对天玑9000的某些硬件模块做了重新设计,和率先采用台积电4nm工艺都能看得出来。VNSednc

联发科今年在R&D上的支出达到了33亿美元。联发科CEO Rick Tsai在发言中说联发科所有的能力、“我们的核心能力,都将在未来3-5年内为联发科带来光明的未来”。我们认为,天玑9000汇聚了近些年联发科技术储备的核心构成。VNSednc

Joe在发布会最后的总结发言中说:“我们最新发布的旗舰级天玑9000,对联发科而言是非常重要、具备里程碑意义的产品。”天玑9000的确是这些年,在联发科的产品线中,担纲“旗舰”定位的芯片中,在市场表现上最受联发科重视的一个型号了。那我们就来看看天玑9000有什么特别。VNSednc

VNSednc

从总体上看天玑9000

按照惯例,先来看看天玑9000的一些基本参数:VNSednc

制造工艺:TSMC 4nm;VNSednc

CPU:1x Cortex-X2 3.05GHz + 3x Cortex-A710 2.85GHz + 4x Cortex-A510 1.8GHz;VNSednc

GPU:Mali-G710 MC10;VNSednc

AI处理器(APU):4x performance core + 2x flexible core。VNSednc

ISP:Imagiq Gen 7,最高支持9 GigaPixel/s吞吐,3.2亿像素摄像头;3-core 3-exp HDR-ISP(3个3200像素摄像头支持,整个系统270fps的处理能力,18bit管线);4K 3-exp视频HDR支持;AI-Video架构;VNSednc

视频与显示:8K视频编解码器,支持8K AV1视频播放;显示输出支持最高WQHD+ @144Hz/FHP+ @180Hz,HDR10+ Adaptive支持;VNSednc

Modem:5G Rel.16;支持下行载波聚合3CC最高300MHz频宽(3x100MHz)、7Gbps速率;上行R16 UL增强;UltraSave 2.0节电特性支持;VNSednc

其他连接:WiFi 6E(6GHz);蓝牙5.3;完整的GNSS支持;VNSednc

内存支持:LPDDR5x-7500;VNSednc

这其中有很多个“全球首发”,包括首个采用TSMC 4nm制造工艺,首个采用Cortex-X2 IP;首个采用Mali-G710 IP;首个支持LPDDR5x 7500;首个3.2亿像素摄像头支持;首个3-cam 3-exp 18bit HDR;首个8K AV1视频播放支持;首个5G下行3CC载波聚合300MHz 7Gbps实现;首个R16 UL Enhancement支持;智能手机上首个支持蓝牙5.3。VNSednc

从整体来看,这个时间节点下,其中的大部分配置都还是相当豪华的,起码天玑9000的旗舰定位是没有疑问的。针对其中的各组成部分,我们再剖开来谈一谈。VNSednc

CPU部分:首个Armv9实现

从发布时间来看,这的确是市面上最早宣布的采用Armv9指令集的处理器。有关Cortex-X2/A710/A510的分析,我们已经在此前的文章里做过详述。这三个IP是今年年中Arm面向大众发布的,其亮点在于都基于Armv9指令集,而且基本切断了对32位AArch32执行模式的支持(除了为考虑中国市场的Cortex-A710之外)。VNSednc

1+3+4的配置,从此前的Cortex-X1开始就比较常见了。Arm说Cortex-X2在IPC上相比X1提升了16%;而A710相比前代Cortex-A78的同频性能提升最高10%(且同等性能下功耗降低30%);小核心A510的改进应该是最大的,相比年迈的A55有35-50%的性能提升,峰值性能下有20%的功耗红利。有关CPU核心更具体的架构变化,此处不再多做赘述。VNSednc

VNSednc

尤为值得一提的是天玑9000在CPU缓存方面的提升:L3 cache容量增大至8MB;而在整个SoC上面向几个主要IP的SLC(system level cache)容量增长至6MB。所以联发科在发布会上宣称,移动CPU架构的cache达成了“PC级cache设计”,达到了“14MB”——虽然我们感觉把L3 cache和SLC加起来还是挺奇怪的。VNSednc

这个容量变化其实并不让人意外,此前Arm在发布Cortex-X2的时候,推荐的L3 cache就是8MB。而且我们在分析文章里也提到过,8MB L3 cache是这次Arm新IP实现性能提升的关键。6MB SLC在Android阵营里是比较大的。相对来说,高通骁龙888的L3 cache是4MB,SLC则为3MB。不过和苹果还是不大能比(A15的SLC达到了32MB)。联发科方面说14MB的cache系统,对性能提升最多能起到7%的帮助作用,而且能够降低带宽消耗25%。VNSednc

VNSednc

宣传上,联发科还特别将14MB这个容量和Intel酷睿处理器(面向笔记本)作了比较,如上图所示。如果是11代酷睿的话,这里列出的i7处理器12MB cache应该是指LLC(具体是L3 cache)。VNSednc

这个对比实际上没那么公平,意义也不大:一方面在于Intel酷睿处理器的L2 cache其实会更大;另一方面x86平台的cache系统在设计上和Arm阵营不是一回事,比如L3 cache在系统中扮演的角色就不一样(x86这边也没有SLC),再比如x86这边在L1 cache也不可能像当代Arm那样做得那么大。VNSednc

此外,天玑9000的Cortex-X2大核L2 cache也选配了1MB,A710的L2 cache为512KB,这都是Arm官方推荐的配置更大档位的方案,也能说明天玑9000的旗舰定位。VNSednc

VNSednc

联发科提到,天玑9000“相比现在的Android旗舰,峰值性能提升最高35%”,“与此同时能效提升至多37%”——这一点主要说的是Cortex-X2。这个说法还是比较模糊,具体对比对象不明。感觉综合4nm的工艺红利,和Cortex-X2的架构提升,相比X1还是很难达成35%的性能提升。VNSednc

VNSednc

联发科给了具体的基准测试比较。这里35%是基于SPECint2K6的测试,系统级的性能提升(?)。在核心级别上,Geekbench 5.0测得天玑9000单核性能提升为10%。作为对比,Arm此前在发布会上提过,Cortex-X2基于SPECint2K6测试,相比X1,IPC提升最多16%。所以天玑9000的具体实现相当值得做后续观察。当然我们不清楚此处联发科具体对比的是谁。VNSednc

VNSednc

CPU多核性能方面,联发科表示天玑9000在Geekbench 5.0中的跑分超过4000分。上面这张图除了对比“Android旗舰”以外,中间两个“2021旗舰”和“2020旗舰”代表的应该是iPhone(因为发言人在演讲中说So we compare not just to the Android flagship today, we also compared to the non-Android phones which is 2020 version and 2021 version which is made by the Cupertino company.)VNSednc

这样的表现的确不错,不过苹果A系列的强项实际上主要在单核性能上;而且请注意采用天玑9000的手机是明年才要正式上市的。但另一方面,比所谓今年的“Android旗舰”在跑分上高出这么多,的确也是相当出彩的成绩了。VNSednc

VNSednc

实际体验方面,联发科给了不同app在天玑9000平台之下的启动时间,与“Android旗舰”的速度对比。其中Netflix开启时间快了55%,一些重型负载如游戏应用的开启速度提升幅度也在12%-50%区间。VNSednc

GPU:好像支持光追

GPU方面,天玑9000选择的Mali-G710是10核心版。事实上,Arm在发布Mali-G710的时候提及可配置的shader核心数在7-16个。具体表现如何,还是要看将来产品发布时,核心频率等各方面的因素(LPDDR5x 7500支持在此应该会有帮助)。VNSednc

VNSednc

前文未提及的一点是,联发科在会上稍稍提天玑9000“实施了光线追踪特性,把PC级的游戏体验带到移动端”,但再未谈及更多信息。前不久联发科召开的媒体分享会上,提到过光线追踪实施的进展。不过据我们所知,Mali-G710并没有硬件级的光线追踪支持——起码其中还没有光追的专用加速硬件。VNSednc

我们猜测天玑9000基于Vulkan API的光线追踪支持,仍然是软件级的。但联发科此前谈到过,已经在硬件层面开始布局对未来最终光追硬件实现的逐步支持(比如cache/buffer之类,猜想天玑9000也是联发科通往完整光追硬件支持的重要一步。VNSednc

性能提升方面,联发科表示天玑9000的Mali-G710 GPU相比2021的“Android旗舰”有最多35%性能领先,能效则最多有60%的优势。对比对象不明确,无法做出确切判断。VNSednc

VNSednc

在具体的持续游戏性能上,联发科给了上面这张图。这张图测试的是对某款“流行的沙盒游戏”在60fps设定、5G网络开启的情况下,持续玩24分钟,帧率上的变化情况。注意这张图的对比对象可能是iPhone 13,而联发科也在会上提到对比的游戏就是《原神》。从这张图可见,天玑9000的游戏帧率会更为平稳,受发热限制可坚持的帧率也会略高。VNSednc

不过这种对比其实更考验的是系统性能,包括OEM厂商的散热设计在其中占到的比重会非常大。VNSednc

VNSednc

更多类型的游戏比较如上图,这里的“2021旗舰”看起来相当奇怪......不过若主流游戏都可满帧跑(而且是平均帧率),不管竞品是谁,天玑9000对手游爱好者而言的确是相当值得期待的。VNSednc

这部分另外值得一提的是天玑9000对于LPDDR5x 7500MT/s的支持。联发科提到LPDDR5x 7500相比LPDDR5 5500,能够将带宽提升36%,在重度负载下让延迟降低20%。去年和今年的旗舰手机的确大多都在用LPDDR5。VNSednc

VNSednc

LPDDR5x还是相当新的方案,本月月初三星才刚刚宣布开发出了首个14nm 16Gb的LPDDR5x DRAM。此前三星给的数字是相比LPDDR5实现1.3倍处理速度提升,以及将近20%的功耗降低。这几天,美光也刚刚宣布联发科验证了其LPDDR5x DRAM,针对的就是天玑9000。美光给的数字是LPDDR5x峰值8.544Gb/s,相比LPDDR5提升至多33%的性能。VNSednc

LPDDR5x的采用,理论上应该也是游戏帧率得到提升的部分原因。VNSednc

AI性能:比比苹果和谷歌

当代手机SoC不能忽略的另一个亮点自然就是AI专核了,联发科将自家的AI专核称为APU。这也是联发科自研IP的重要组成部分,或者说APU已经成为如今联发科在手机SoC市场上实现差异化竞争的关键。前不久的媒体分享会报道中,我们也特别提到了联发科对AI的看法,以及联发科提出的以“每瓦有效算力”来评判AI处理器的性能和效率,建议关注端侧AI inference的各位前往阅读。VNSednc

这次天玑9000之中的APU采用4个性能核(Performance Core),加两个弹性核(Flexible Core),简单理解应该就是4大核、2小核的设计。上一代产品中,联发科用的是2大核+3小核方案。所以联发科宣称天玑9000在AI性能上提升了多达400%,与此同时能效(Power Efficiency)也提升了4倍。VNSednc

似乎大部分端侧AI芯片或IP供应商对于自家芯片架构都甚少提及,联发科也没有在会上去谈自家APU的架构。相比“2021旗舰”(这里应该又是指iPhone-by Cupertino company),AI性能领先66%,能效则有31%的优势。以下是跑具体的一些应用和NN时的对比:VNSednc

VNSednc

对象检测和图片分类的确都是手机上比较具有代表性的AI应用场景,跑的是MobileDet、MobileNet V3、V2网络。VNSednc

除此之外,联发科还特别将天玑9000的APU和谷歌发布没多久的Pixel 6手机之上的Tensor处理器作了比较。对比的是AI ETHZ v4——苏黎世联邦理工学院的AI Benchmark,在业界也颇具名声。联发科表示,天玑9000相比Tensor,在AI性能上有至多16%的性能领先。VNSednc

VNSednc

更具体的一些对比项目如上图,项目包括视频AI降噪、去模糊等。VNSednc

ISP、媒体与显示

而在手机SoC之上,除了CPU、GPU和AI专核这几大件之外,芯片厂商普遍强调的还有ISP(图像处理器),毕竟影像性能可是下游手机产品的宣传重点。天玑9000也不例外。VNSednc

天玑9000之上的ISP是联发科的第七代Imagiq。联发科称其为全球首个3.2亿像素支持的ISP,吞吐9 GigaPixel/s。这次的新ISP据说相比上一代,是全新设计的架构(completely re-design on the pipeline)。在吞吐上这一代ISP相比前代提升2倍,视频降噪性能10倍提升。VNSednc

视频拍摄支持方面包括4K HDR拍摄,还有个AI-Video架构。VNSednc

VNSednc

这次的ISP是个3核(3 ISPs)设计,每个ISP(核)可处理3-exposure图片(应该是指3次不同曝光的帧或画面)。那么到视频拍摄上,就能够以HDR的方式同时捕捉3-exposure 18bit的视频(联发科表示,Imagiq Gen 7是全球首个能够在ISP管线上实施18bit的方案)。联发科称其为全球首个实现硬件级的3-cam 3-exp 18-bit video HDR支持,3个ISP(核)一起工作的话,就是每秒处理270帧画面。VNSednc

VNSednc

对于所谓的3 exposure,联发科还在会上将其与2 exposure的方案作了对比。联发科表示,3 exposure输出的18bit HDR画面更加接近人眼动态范围(这个对比应该是指,视频拍摄的每一帧,都以三次曝光执行HDR合成)。VNSednc

当然,ISP与AI的合作是现在的手机SoC芯片厂商普遍在做的事情了。毕竟AI在影像拍摄过程中正扮演越来越重要的角色。前文提到的AI-Video架构应该就是联发科的方案。天玑9000主要强调的是有个VSE(视频流引擎)——这是架构层面的改进,“融合ISP与APU的流处理”,“视频拍摄或大型照片处理时,不需要再频繁通过DRAM来交换数据”。VNSednc

VNSednc

联发科针对这个VSE并未提供更多信息,可能和增大片内cache有关?此前,我们在《手机拍照:在AI面前,1亿像素都是垃圾》一文中谈到过,麒麟9000采用一种Smart Cache,以及帧切片的方式实现ISP与NPU的数据互通,避免数据频繁通过片外存储来读写。猜测VSE可能与此会比较类似。联发科表示,VSE能够将功耗降低至多17%,延迟减少至多33ms,如此一来也就能进行更多特性的视频实时录制和处理。VNSednc

这样的算力与架构,是实现照片与视频拍摄质量的基础。不过影像内容创作,就ISP层面更重要的还在于OEM厂商所采用的算法。VNSednc

在内容呈现上,关乎到SoC之上显示与媒体/视频编解码模块。视频方面,天玑9000支持8K视频编解码,其中包括8K AV1格式的视频播放。对此联发科表示现如今很多视频流服务都升级到了AV1。所以将其固化为一个模块也是必然的。显示方面,天玑9000支持最高144Hz刷新率2K分辨率屏幕,或180Hz的全高清分辨率屏幕显示,以及对HDR10+ Adaptive提供支持。VNSednc

谈谈5G modem和天玑9000的低功耗

在连接(Connectivity)支持上,天玑9000将WiFi支持的频宽翻倍至160MHz。这次对WiFi 6E的支持,应该是真正能够发挥160MHz频宽的组成部分。另外天玑9000是智能手机中首个实现蓝牙5.3支持的芯片——估计对用户而言,蓝牙耳机降低延迟是其更有价值的一个应用场景。VNSednc

VNSednc

VNSednc

无线连接的5G支持方面,这次的天玑9000虽然仍然不支持毫米波,但开始支持sub-6GHz下行的3CC载波聚合,频宽300MHz最高带宽7Gbps——今年9月份,是德科技就发布消息提到过和联发科在这方面的合作,即在sub-6GHz范围内,聚合3个5G NR载波达成300MHz频宽。VNSednc

此外还有对于更多5G Rel-16特性的支持,包括“全球首个R16 UL Enhancement”,相比Rel-15在弱信号区域的上行速度能够提升最高3倍。这些特性都是联发科技术投入上的重要组成部分。VNSednc

VNSednc

对于5G支持,联发科另一个强调的重点是持续加强UltraSave技术。天玑9000采用的是迭代版的UltraSave 2.0。联发科表示,相比“2021旗舰”(iPhone),在Connected模式下功耗降低至多32%,High Speed模式下功耗降低至多27%。这里的High Speed模式,在联发科的定义里似乎在于视频流这类持续高速使用5G流量的典型应用中。具体如何实现节电的,联发科在发布会上并没有提到。VNSednc

谈到低功耗,这次联发科CEO Rick Tsai演讲中多次提到了联发科对于“低功耗”的看重,讲话开头、中间和结尾都不忘提“低功耗”,并强调在技术上要从低功耗走向高性能,难度会显著地低于从高性能走进低功耗。联发科的主场毕竟在边缘和端侧设备上,IoT也是其重要市场,追逐低功耗也是应该的。VNSednc

VNSednc

针对天玑9000,联发科表示:我们采用新的技术,新的低功耗架构,将功耗控制到最低级别。上图的这组对比,比较的也是“Android旗舰”。具体的场景包括了飞行模式、空闲模式、音乐播放、8K视频播放、4K视频录制、游戏等。不同场景下,天玑9000可实现的功耗相比竞品有不同程度的优势。不过类似8K视频播放这种场景,大约和新加的解码模块有关吧。VNSednc

而且联发科如今造旗舰手机SoC芯片有个特别的优势,就是台积电在工艺上会显著的更为成熟。N4虽然不是什么大版本迭代,但台积电在规划上会将其列为主流SoC的重要制造工艺。这一点此前探讨工艺的文章里也已经介绍过。而三星4LPE实际上可能存在更大的不确定性,因为4LPE目前是作为7LPP之后的完整迭代,包含了pitch scaling的。这会成为明年与高通的竞争中,联发科的一个重要优势项。VNSednc

VNSednc

手机SoC是其他业务的重要驱动力

天玑9000无疑肩负着联发科全面征服高端手机市场的使命,所以联发科在其中倾注了很多的技术与心血。而且此前的媒体沟通会也能清晰地看到,联发科在技术上的持续投入,以及未来手机芯片方面的规划路线,包括5G、AI、图形、图像各方面的技术,此前我们都解读过。似乎也是从这几年开始,联发科在技术上的投入和合作也显得明显更为积极。这是将市场扩张至旗舰设备的关键。我们也期待看到明年天玑9000发布之后,市场交付的答卷。VNSednc

比较有趣的是,这次发布会Q&A环节,不少人问及联发科未来业务的发展重点,以及在手机之外其他业务的投入情况。Joe Chen和Rick Tsai对此的解释是,联发科的其他业务增长点此前就已经开始显现:虽然手机芯片业务的增长仍然是最快的,但其他各组成部分的同比增长也都有百分之三四十。VNSednc

更重要的是,手机旗舰SoC“是我们的技术驱动力”,联发科在手机上的很多技术储备,正以更快的速度流向其他应用和市场。包括“我们先进工艺技术、先进封装技术方面的能力,也在其他计算业务上发挥作用”。这也为联发科发展创造了更多的机会。VNSednc

最后,有兴趣的同学可移步这里看一看发布会Q&A环节的更多有料和有趣的问答。VNSednc

责编:DemiVNSednc

  • 来占沙发啦
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了