广告

首次超越苹果?全面剖析华为Mate 40的绝版“麒麟9000”处理器

2020-11-03 10:32:24 黄烨锋 阅读:
由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也相差不大,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。

由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也旗鼓相当,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。v8Sednc

原标题:全面剖析麒麟9000:华为Mate 40碾压了谁?v8Sednc

作者:黄烨锋v8Sednc

华为Mate 40系列手机中国区的发布会今天刚刚在上海举办,其中最引人注目的部分自然就是在这个特殊历史时期出现的海思麒麟(Kirin)9000 SoC了。华为照例在手机发布会前,小规模召开了一次麒麟芯片媒体沟通会。v8Sednc

有关Mate 40系列手机本身,我将另外撰文,与本文同期发布。本文主要探讨麒麟9000这颗芯片——虽然电子工程专辑此前已经在这款手机的全球发布会期间,对这颗芯片做了简单的探讨,我还是希望能够更全面地来呈现这颗,未来回看可能具有历史意义的SoC。v8Sednc

本文篇幅较长,主体上分成5个部分。各位可按照自己感兴趣的话题,选择性阅读:v8Sednc

(1)配置总览v8Sednc

(2)CPUv8Sednc

(3)GPUv8Sednc

(4)NPU(与ISP)v8Sednc

(5)5Gv8Sednc

v8Sednc

153亿个晶体管,配置一览

麒麟9000系列SoC主要包含两个型号,分别是麒麟9000和麒麟9000E。这两者的主要区别是9000E的GPU少两个核心,以及NPU少一个大核。猜测这可能会是个更经济的做法,因为153亿个晶体管实在是很大的规模:苹果A14也“不过”118亿晶体管(当然A14不带modem)。其中这次的Mali G78 GPU铺满24个核心的实施方案,算是巨大规模了。又还是初代5nm工艺,考虑到良率问题——通过binning的方式,在产线上划分出一个9000E,显然会更经济。v8Sednc

首先当然还是看一看麒麟9000的主要配置情况:v8Sednc

CPU:1x Cortex-A77 3.13GHz,3x Cortex-A77 2.56GHz,4x Cortex-A55 2.05GHzv8Sednc

GPU:Mali G78MP24(9000E为MP22)v8Sednc

NPU:Da Vinci,2x Big-Core,1x Tiny-Core(9000E的Big-Core是1个)v8Sednc

内存:LPDDR4X-2133/LPDDR5-2750v8Sednc

Modem:Balong 5000(Sub-6G,下行双载波4.6Gbps,上行双载波2.5Gbps)v8Sednc

ISP:6.0,Quad pipeline,3A(AE/AWB/AF)处理能力提升100%,处理管线速度提升50%v8Sednc

其他:HiFi Audio,4K HDR Video,Mobile Secure Processorv8Sednc

工艺:台积电5nm(N5?)v8Sednc

v8Sednc

这其中比较令人在意的有几点,其一是CPU部分用的是Cortex-A77。已经上市半年多的骁龙865用的就是A77。Arm实则已经发布了Cortex-A78和X1。传言未来的高通骁龙875和Exynos 1080都会采用Cortex-A78。起码在新IP的采用上,麒麟芯片晚了一步。另外GPU部分,华为直接跳过了Mali G77,转而采用Mali G78。这些都会在下文做探讨。v8Sednc

除此之外,今年华为似乎格外在意AI的应用——虽然现在看来Android NN生态(以及华为HiAI)建设仍然比较初级,华为也仍然期望在拍照之外,让算力在行业内领先的NPU有更多的用武之地。v8Sednc

尤为值得一提的是,华为今年公布相关麒麟SoC与竞品的对比数据,华为Fellow艾伟在台上呈现的内容,都更多的出现了“效率”和“能效”,而不再只是单纯的性能。这一点实则也是麒麟SoC已经完全步入成熟的依据:电子工程专辑的微信服务号很快会发布一篇海思手机SoC从K3V2时期开始,至麒麟9000这8年来的发展历程总结文章。这8年是非常典型的由青涩走向成熟,从差强人意迈向一流的过程。v8Sednc

CPU:一次常规升级

麒麟9000 CPU部分是1+3+4组合结构,这种组合方法原本也是DynamIQ灵活性的体现。今年年初的麒麟820 5G用的也是这种组合方式,高通也已经沿用了两代。最大的那颗Cortex-A77核心3.13GHz主频是比骁龙865+(3.1GHz)还要略高一点点的,比去年Kirin 990大核A76的2.86GHz也高了9.4%。Cache分配情况未知。v8Sednc

在提升方面,华为这次并未与前代产品比较,而是说CPU性能比骁龙865+领先10%,能效则领先25%——基于Geekbench 5的跑分。从Geekbench 5数据库来看,骁龙865+相比麒麟990的CPU多核性能领先了大约14-18%。这样算来,麒麟9000比上一代麒麟990,CPU性能提升大约在25-30%左右。v8Sednc

v8Sednc

当然这个对比是不严谨的,Geekbench 5用于反映CPU的绝对性能可能会有偏差。不过Arm官方早前发布A77的时候就提到,Cortex-A77相比A76有着20-25%的IPC提升,加上麒麟9000的频率提升,麒麟9000 CPU整体上25-30%的性能提升是在情理之中的。能效部分与前代很难直接比较,而且骁龙865+作为865的提频版本,在效率上本来就会妥协——麒麟9000 CPU效率必然是提升的,其中还需考虑到5nm工艺带来的红利,与上代产品相较的提升幅度值得做进一步观察。v8Sednc

需要指出的是,华为从麒麟980开始越来越关注存储子系统的提升——980配上了DSU 4MB L3大缓存;到了麒麟990,虽然CPU的整体架构和内存支持都没变,但开始采用新的LLC:system cache(下图中间部分,系统级别的cache),并降低存储子系统的整体延迟,令麒麟990的性能表现仍然比980有提升,而且功耗还更低——这一点在当时还是非常惊艳的。v8Sednc

v8Sednc

Kirin 990 Die shot source: TechInsights - Labelling & Custom contrast: AnandTechv8Sednc

今年麒麟9000似乎将system cache提升到了8MB(艾伟在说NPU环节的Smart Cache 2.0时提到了这一点,“相对直接访问内存来说,带宽提升了一倍,能效提升15%”,但不确定是否就是指整个系统LLC的system cache),这应该是相比上代容量的翻番了。实际上高通和苹果此前也已经开始注重这个层级的cache布局。这部分理论上可以在SoC上服务于多个IP,不仅用于提升性能,而且也提升了能效。v8Sednc

此外,LPDDR5支持实则也会对手机的整体系统性能有提升帮助,骁龙865机型已经享受了这部分红利。相比麒麟990,麒麟9000在CPU方面的确是一次比较大的提升。不过也需要在意,今年年中发布的Cortex-A78能做到与A77相同功耗情况下持续性能20%的提升;预计晚些时间发布的骁龙875还是可以超过麒麟9000的——当然这是一个常态,尤其随着华为的手机SoC步入成熟,每年不同SoC厂商的迭代,都是在不同时间点此消彼长的。

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • MCU上的AI算法在自动驾驶中的实用案例 人工智能(AI)算法和支持硬件对于下一阶段的自动驾驶和最终的自动驾驶实现至关重要,而英飞凌和ZF(德国采埃孚集团)在EEmotion项目中的合作证明了这项雄心勃勃的技术的可行性···
  • AR/VR应用即将迎来爆发,国产高性能SoC已做好准备 从数据存储角度来看,伴随而来的大量数据需要通过“去中心化”进行存储,因此,理想当中的元宇宙背后是各种各样的连接、计算、仿真、人工智能、软件以及区块链这样的技术在做依托。迄今为止,能够连接人和虚拟世界的窗口是AR/VR,但AR/VR设备距离“元宇宙”这个目标还很远。
  • 融合AI算力,进迭时空全球首款8核RISC-V AI CPU面世 过去两年中,进迭时空已经已经完成两款智算核SpacemiT X60和X100的研发工作,并基于SpacemiT X60 智算核心推出全球首颗8核RISC-V AI CPU—SpacemiT Key Stone K1,以及可量产的MUSE系列生态产品。
  • 神经形态计算器件和阵列测试解决方案 神经形态阵列是一种利用忆阻器器件形成的小规模的、实现类似于大脑神经元连接的集成电路。为了探索其应用和优势,有必要开发新的测量技术和模块,对忆阻器器件和阵列进行精确和全面的表征和评估···
  • 放弃造车后,苹果要做家务机器人了 据EDN电子技术设计报道,苹果工程师正致力于开发一种能在家庭环境中自由移动并执行日常任务,如洗碗等家务的机器人。
  • FPGA助力高速未来 FPGA提供无与伦比的灵活性、安全性和高性能,可处理各类复杂任务,包括管理超级高铁网络中的推进、导航和通信等。
  • 如何设计与现场总线无关的智能工厂传感器 这篇博文介绍了智能工厂传感器(温度和压力)的设计理念,无论工厂流程中使用何种类型的现场总线或工业以太网,这些传感器都能与PLC进行通信。
  • 小米SU7首拆:看看主控Orin X、8295芯片到底长啥样 据博主@杨长顺维修家 抖音视频显示,他提车后第一时间拆掉了新车的主控,并在解说中将其与特斯拉做了比较。
  • 继日本台积电晶圆厂之后,先进封装工厂将是下一个目标 日本重启芯片行业的努力很可能再次获得利好:台积电(TSMC)将要建设新的先进封装工厂……
  • Cadence 扩充 Tensilica Vision 产品线,新增毫米波 单个 DSP 用于嵌入式视觉、雷达、激光雷达和 AI 处理,在性能提升的前提下,带来显著的面积优化、功耗和成本的降低;针对 4D 成像雷达工作负载,新增的雷达加速器功能可提供高度可编程的硬件解决方案,显著提升性能;专为多传感器汽车、无人机、机器人和自动驾驶汽车系统设计中的传感器融合处理而设计~
  • 采用芯原NPU IP的AI类芯片已在全球出货超过1亿颗 芯原股份2024年2月29日宣布集成了芯原神经网络处理器(NPU)IP的人工智能(AI)类芯片已在全球范围内出货超过1亿颗,主要应用于物联网、可穿戴设备、智慧电视、智慧家居、安防监控、服务器、汽车电子、智能手机、平板电脑、智慧医疗等10个市场领域。在过去七年里,芯原在嵌入式AI/NPU领域全球领先,其NPU IP已被72家客户用于上述市场领域的128款AI芯片中。
  • 工厂智能化三要素:电源管理IC、处理器和传感器 能源效率是工业4.0的一项主要指令,为的是提高生产力和降低成本,同时减少对环境的影响。智能工厂有赖于一系列元器件——包括电源管理IC(PMIC)、处理器和传感器——来处理监控、收集和分析数据的任务,以确定优化生产流程和降低能耗的最佳方法。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了