由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也旗鼓相当,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。
原标题:全面剖析麒麟9000:华为Mate 40碾压了谁?
作者:黄烨锋
华为Mate 40系列手机中国区的发布会今天刚刚在上海举办,其中最引人注目的部分自然就是在这个特殊历史时期出现的海思麒麟(Kirin)9000 SoC了。华为照例在手机发布会前,小规模召开了一次麒麟芯片媒体沟通会。
有关Mate 40系列手机本身,我将另外撰文,与本文同期发布。本文主要探讨麒麟9000这颗芯片——虽然电子工程专辑此前已经在这款手机的全球发布会期间,对这颗芯片做了简单的探讨,我还是希望能够更全面地来呈现这颗,未来回看可能具有历史意义的SoC。
本文篇幅较长,主体上分成5个部分。各位可按照自己感兴趣的话题,选择性阅读:
(1)配置总览
(2)CPU
(3)GPU
(4)NPU(与ISP)
(5)5G
麒麟9000系列SoC主要包含两个型号,分别是麒麟9000和麒麟9000E。这两者的主要区别是9000E的GPU少两个核心,以及NPU少一个大核。猜测这可能会是个更经济的做法,因为153亿个晶体管实在是很大的规模:苹果A14也“不过”118亿晶体管(当然A14不带modem)。其中这次的Mali G78 GPU铺满24个核心的实施方案,算是巨大规模了。又还是初代5nm工艺,考虑到良率问题——通过binning的方式,在产线上划分出一个9000E,显然会更经济。
首先当然还是看一看麒麟9000的主要配置情况:
CPU:1x Cortex-A77 3.13GHz,3x Cortex-A77 2.56GHz,4x Cortex-A55 2.05GHz
GPU:Mali G78MP24(9000E为MP22)
NPU:Da Vinci,2x Big-Core,1x Tiny-Core(9000E的Big-Core是1个)
内存:LPDDR4X-2133/LPDDR5-2750
Modem:Balong 5000(Sub-6G,下行双载波4.6Gbps,上行双载波2.5Gbps)
ISP:6.0,Quad pipeline,3A(AE/AWB/AF)处理能力提升100%,处理管线速度提升50%
其他:HiFi Audio,4K HDR Video,Mobile Secure Processor
工艺:台积电5nm(N5?)
这其中比较令人在意的有几点,其一是CPU部分用的是Cortex-A77。已经上市半年多的骁龙865用的就是A77。Arm实则已经发布了Cortex-A78和X1。传言未来的高通骁龙875和Exynos 1080都会采用Cortex-A78。起码在新IP的采用上,麒麟芯片晚了一步。另外GPU部分,华为直接跳过了Mali G77,转而采用Mali G78。这些都会在下文做探讨。
除此之外,今年华为似乎格外在意AI的应用——虽然现在看来Android NN生态(以及华为HiAI)建设仍然比较初级,华为也仍然期望在拍照之外,让算力在行业内领先的NPU有更多的用武之地。
尤为值得一提的是,华为今年公布相关麒麟SoC与竞品的对比数据,华为Fellow艾伟在台上呈现的内容,都更多的出现了“效率”和“能效”,而不再只是单纯的性能。这一点实则也是麒麟SoC已经完全步入成熟的依据:电子工程专辑的微信服务号很快会发布一篇海思手机SoC从K3V2时期开始,至麒麟9000这8年来的发展历程总结文章。这8年是非常典型的由青涩走向成熟,从差强人意迈向一流的过程。
麒麟9000 CPU部分是1+3+4组合结构,这种组合方法原本也是DynamIQ灵活性的体现。今年年初的麒麟820 5G用的也是这种组合方式,高通也已经沿用了两代。最大的那颗Cortex-A77核心3.13GHz主频是比骁龙865+(3.1GHz)还要略高一点点的,比去年Kirin 990大核A76的2.86GHz也高了9.4%。Cache分配情况未知。
在提升方面,华为这次并未与前代产品比较,而是说CPU性能比骁龙865+领先10%,能效则领先25%——基于Geekbench 5的跑分。从Geekbench 5数据库来看,骁龙865+相比麒麟990的CPU多核性能领先了大约14-18%。这样算来,麒麟9000比上一代麒麟990,CPU性能提升大约在25-30%左右。
当然这个对比是不严谨的,Geekbench 5用于反映CPU的绝对性能可能会有偏差。不过Arm官方早前发布A77的时候就提到,Cortex-A77相比A76有着20-25%的IPC提升,加上麒麟9000的频率提升,麒麟9000 CPU整体上25-30%的性能提升是在情理之中的。能效部分与前代很难直接比较,而且骁龙865+作为865的提频版本,在效率上本来就会妥协——麒麟9000 CPU效率必然是提升的,其中还需考虑到5nm工艺带来的红利,与上代产品相较的提升幅度值得做进一步观察。
需要指出的是,华为从麒麟980开始越来越关注存储子系统的提升——980配上了DSU 4MB L3大缓存;到了麒麟990,虽然CPU的整体架构和内存支持都没变,但开始采用新的LLC:system cache(下图中间部分,系统级别的cache),并降低存储子系统的整体延迟,令麒麟990的性能表现仍然比980有提升,而且功耗还更低——这一点在当时还是非常惊艳的。
Kirin 990 Die shot source: TechInsights - Labelling & Custom contrast: AnandTech
今年麒麟9000似乎将system cache提升到了8MB(艾伟在说NPU环节的Smart Cache 2.0时提到了这一点,“相对直接访问内存来说,带宽提升了一倍,能效提升15%”,但不确定是否就是指整个系统LLC的system cache),这应该是相比上代容量的翻番了。实际上高通和苹果此前也已经开始注重这个层级的cache布局。这部分理论上可以在SoC上服务于多个IP,不仅用于提升性能,而且也提升了能效。
此外,LPDDR5支持实则也会对手机的整体系统性能有提升帮助,骁龙865机型已经享受了这部分红利。相比麒麟990,麒麟9000在CPU方面的确是一次比较大的提升。不过也需要在意,今年年中发布的Cortex-A78能做到与A77相同功耗情况下持续性能20%的提升;预计晚些时间发布的骁龙875还是可以超过麒麟9000的——当然这是一个常态,尤其随着华为的手机SoC步入成熟,每年不同SoC厂商的迭代,都是在不同时间点此消彼长的。