首次超越苹果？全面剖析华为Mate 40的绝版“麒麟9000”处理器-EDN 电子技术设计

 由于受到美国打压，华为的麒麟9000处理器成为“绝唱”，也是Mate 40系列手机的绝版处理器，国外Mate40起步价高达899欧元，国内起步价高达4999，Mate 40 Pro国内高达6499+。从定价看，华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几，从功能上看也相差不大，有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看，性能如何呢？本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。

由于受到美国打压，华为的麒麟9000处理器成为“绝唱”，也是Mate 40系列手机的绝版处理器，国外Mate40起步价高达899欧元，国内起步价高达4999，Mate 40 Pro国内高达6499+。从定价看，华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几，从功能上看也旗鼓相当，有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看，性能如何呢？本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。nwTednc

原标题：全面剖析麒麟9000：华为Mate 40碾压了谁？nwTednc

作者：黄烨锋nwTednc

华为Mate 40系列手机中国区的发布会今天刚刚在上海举办，其中最引人注目的部分自然就是在这个特殊历史时期出现的海思麒麟（Kirin）9000 SoC了。华为照例在手机发布会前，小规模召开了一次麒麟芯片媒体沟通会。nwTednc

有关Mate 40系列手机本身，我将另外撰文，与本文同期发布。本文主要探讨麒麟9000这颗芯片——虽然电子工程专辑此前已经在这款手机的全球发布会期间，对这颗芯片做了简单的探讨，我还是希望能够更全面地来呈现这颗，未来回看可能具有历史意义的SoC。nwTednc

本文篇幅较长，主体上分成5个部分。各位可按照自己感兴趣的话题，选择性阅读：nwTednc

（1）配置总览nwTednc

（2）CPUnwTednc

（3）GPUnwTednc

（4）NPU（与ISP）nwTednc

（5）5GnwTednc

nwTednc

153亿个晶体管，配置一览

麒麟9000系列SoC主要包含两个型号，分别是麒麟9000和麒麟9000E。这两者的主要区别是9000E的GPU少两个核心，以及NPU少一个大核。猜测这可能会是个更经济的做法，因为153亿个晶体管实在是很大的规模：苹果A14也“不过”118亿晶体管（当然A14不带modem）。其中这次的Mali G78 GPU铺满24个核心的实施方案，算是巨大规模了。又还是初代5nm工艺，考虑到良率问题——通过binning的方式，在产线上划分出一个9000E，显然会更经济。nwTednc

首先当然还是看一看麒麟9000的主要配置情况：nwTednc

CPU：1x Cortex-A77 3.13GHz，3x Cortex-A77 2.56GHz，4x Cortex-A55 2.05GHznwTednc

GPU：Mali G78MP24（9000E为MP22）nwTednc

NPU：Da Vinci，2x Big-Core，1x Tiny-Core（9000E的Big-Core是1个）nwTednc

内存：LPDDR4X-2133/LPDDR5-2750nwTednc

Modem：Balong 5000（Sub-6G，下行双载波4.6Gbps，上行双载波2.5Gbps）nwTednc

ISP：6.0，Quad pipeline，3A（AE/AWB/AF）处理能力提升100%，处理管线速度提升50%nwTednc

其他：HiFi Audio，4K HDR Video，Mobile Secure ProcessornwTednc

工艺：台积电5nm（N5？）nwTednc

nwTednc

这其中比较令人在意的有几点，其一是CPU部分用的是Cortex-A77。已经上市半年多的骁龙865用的就是A77。Arm实则已经发布了Cortex-A78和X1。传言未来的高通骁龙875和Exynos 1080都会采用Cortex-A78。起码在新IP的采用上，麒麟芯片晚了一步。另外GPU部分，华为直接跳过了Mali G77，转而采用Mali G78。这些都会在下文做探讨。nwTednc

除此之外，今年华为似乎格外在意AI的应用——虽然现在看来Android NN生态（以及华为HiAI）建设仍然比较初级，华为也仍然期望在拍照之外，让算力在行业内领先的NPU有更多的用武之地。nwTednc

尤为值得一提的是，华为今年公布相关麒麟SoC与竞品的对比数据，华为Fellow艾伟在台上呈现的内容，都更多的出现了“效率”和“能效”，而不再只是单纯的性能。这一点实则也是麒麟SoC已经完全步入成熟的依据：电子工程专辑的微信服务号很快会发布一篇海思手机SoC从K3V2时期开始，至麒麟9000这8年来的发展历程总结文章。这8年是非常典型的由青涩走向成熟，从差强人意迈向一流的过程。nwTednc

CPU：一次常规升级

麒麟9000 CPU部分是1+3+4组合结构，这种组合方法原本也是DynamIQ灵活性的体现。今年年初的麒麟820 5G用的也是这种组合方式，高通也已经沿用了两代。最大的那颗Cortex-A77核心3.13GHz主频是比骁龙865+（3.1GHz）还要略高一点点的，比去年Kirin 990大核A76的2.86GHz也高了9.4%。Cache分配情况未知。nwTednc

在提升方面，华为这次并未与前代产品比较，而是说CPU性能比骁龙865+领先10%，能效则领先25%——基于Geekbench 5的跑分。从Geekbench 5数据库来看，骁龙865+相比麒麟990的CPU多核性能领先了大约14-18%。这样算来，麒麟9000比上一代麒麟990，CPU性能提升大约在25-30%左右。nwTednc

nwTednc

当然这个对比是不严谨的，Geekbench 5用于反映CPU的绝对性能可能会有偏差。不过Arm官方早前发布A77的时候就提到，Cortex-A77相比A76有着20-25%的IPC提升，加上麒麟9000的频率提升，麒麟9000 CPU整体上25-30%的性能提升是在情理之中的。能效部分与前代很难直接比较，而且骁龙865+作为865的提频版本，在效率上本来就会妥协——麒麟9000 CPU效率必然是提升的，其中还需考虑到5nm工艺带来的红利，与上代产品相较的提升幅度值得做进一步观察。nwTednc

需要指出的是，华为从麒麟980开始越来越关注存储子系统的提升——980配上了DSU 4MB L3大缓存；到了麒麟990，虽然CPU的整体架构和内存支持都没变，但开始采用新的LLC：system cache（下图中间部分，系统级别的cache），并降低存储子系统的整体延迟，令麒麟990的性能表现仍然比980有提升，而且功耗还更低——这一点在当时还是非常惊艳的。nwTednc

nwTednc

Kirin 990 Die shot source: TechInsights - Labelling & Custom contrast: AnandTechnwTednc

今年麒麟9000似乎将system cache提升到了8MB（艾伟在说NPU环节的Smart Cache 2.0时提到了这一点，“相对直接访问内存来说，带宽提升了一倍，能效提升15%”，但不确定是否就是指整个系统LLC的system cache），这应该是相比上代容量的翻番了。实际上高通和苹果此前也已经开始注重这个层级的cache布局。这部分理论上可以在SoC上服务于多个IP，不仅用于提升性能，而且也提升了能效。nwTednc

此外，LPDDR5支持实则也会对手机的整体系统性能有提升帮助，骁龙865机型已经享受了这部分红利。相比麒麟990，麒麟9000在CPU方面的确是一次比较大的提升。不过也需要在意，今年年中发布的Cortex-A78能做到与A77相同功耗情况下持续性能20%的提升；预计晚些时间发布的骁龙875还是可以超过麒麟9000的——当然这是一个常态，尤其随着华为的手机SoC步入成熟，每年不同SoC厂商的迭代，都是在不同时间点此消彼长的。

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

1/3 1 2 3 下一页尾页

阅读全文，请先

黄烨锋

欧阳洋葱，编辑、上海记者，专注成像、移动与半导体，热爱理论技术研究。

进入专栏

处理器/DSP 新品消费电子 EDA/IP/IC设计物联网通信

上一篇： 华为绝版“麒麟9000”遇劲敌“骁龙875”，跑分曝光惹争议 下一篇： 传苹果正在研发“小号版”MacBook Pro，采用自研ARM芯片

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

AI 大模型迈向多模态，助力具身智能与机器人实现创新你听过莫拉维克悖论 (Moravec's paradox) 吗？该悖论指出，对于人工智能 (AI) 系统而言，高级推理只需非常少的计算能力，而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源···
为什么DAC和ADC对于扩展量子计算机至关重要？ DAC和ADC将在量子计算机扩展过程中发挥关键作用，加速量子计算机朝向更复杂的实际应用发展…
MCU上的AI算法在自动驾驶中的实用案例人工智能(AI)算法和支持硬件对于下一阶段的自动驾驶和最终的自动驾驶实现至关重要，而英飞凌和ZF(德国采埃孚集团)在EEmotion项目中的合作证明了这项雄心勃勃的技术的可行性···
AR/VR应用即将迎来爆发，国产高性能SoC已做好准备从数据存储角度来看，伴随而来的大量数据需要通过“去中心化”进行存储，因此，理想当中的元宇宙背后是各种各样的连接、计算、仿真、人工智能、软件以及区块链这样的技术在做依托。迄今为止，能够连接人和虚拟世界的窗口是AR/VR，但AR/VR设备距离“元宇宙”这个目标还很远。
融合AI算力，进迭时空全球首款8核RISC-V AI CPU面世过去两年中，进迭时空已经已经完成两款智算核SpacemiT X60和X100的研发工作，并基于SpacemiT X60 智算核心推出全球首颗8核RISC-V AI CPU—SpacemiT Key Stone K1，以及可量产的MUSE系列生态产品。
神经形态计算器件和阵列测试解决方案神经形态阵列是一种利用忆阻器器件形成的小规模的、实现类似于大脑神经元连接的集成电路。为了探索其应用和优势，有必要开发新的测量技术和模块，对忆阻器器件和阵列进行精确和全面的表征和评估···
放弃造车后，苹果要做家务机器人了据EDN电子技术设计报道，苹果工程师正致力于开发一种能在家庭环境中自由移动并执行日常任务，如洗碗等家务的机器人。
FPGA助力高速未来 FPGA提供无与伦比的灵活性、安全性和高性能，可处理各类复杂任务，包括管理超级高铁网络中的推进、导航和通信等。
如何设计与现场总线无关的智能工厂传感器这篇博文介绍了智能工厂传感器（温度和压力）的设计理念，无论工厂流程中使用何种类型的现场总线或工业以太网，这些传感器都能与PLC进行通信。
小米SU7首拆：看看主控Orin X、8295芯片到底长啥样据博主@杨长顺维修家抖音视频显示，他提车后第一时间拆掉了新车的主控，并在解说中将其与特斯拉做了比较。
继日本台积电晶圆厂之后，先进封装工厂将是下一个目标日本重启芯片行业的努力很可能再次获得利好：台积电(TSMC)将要建设新的先进封装工厂……
Cadence 扩充 Tensilica Vision 产品线，新增毫米波单个 DSP 用于嵌入式视觉、雷达、激光雷达和 AI 处理，在性能提升的前提下，带来显著的面积优化、功耗和成本的降低；针对 4D 成像雷达工作负载，新增的雷达加速器功能可提供高度可编程的硬件解决方案，显著提升性能；专为多传感器汽车、无人机、机器人和自动驾驶汽车系统设计中的传感器融合处理而设计~

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

首次超越苹果？全面剖析华为Mate 40的绝版“麒麟9000”处理器

153亿个晶体管，配置一览

CPU：一次常规升级