广告

首次超越苹果?全面剖析华为Mate 40的绝版“麒麟9000”处理器

2020-11-03 10:32:24 黄烨锋 阅读:
由于受到美国打压,华为的麒麟9000处理器成为“绝唱”,也是Mate 40系列手机的绝版处理器,国外Mate40起步价高达899欧元,国内起步价高达4999,Mate 40 Pro国内高达6499+。从定价看,华为Mate 40/Pro已经与苹果iPhone 12 Pro相差无几,从功能上看也相差不大,有些功能譬如屏下指纹、四摄、反向无线充电等甚至是苹果没有的。那么从麒麟9000这个“绝版”处理器上来看,性能如何呢?本文就从CPU、GPU、NPU、5G等各个方面全面剖析华为Mate 40的绝版“麒麟9000”处理器。
v8Sednc

v8Sednc

视频逐帧卡通化处理v8Sednc

首先是AI视频处理。2017年的麒麟970时代,华为演示2000张照片智能识图需要60秒,而到了麒麟9000同样的识图过程只需要1秒钟。这一点带来的价值放到视频之上,就是AI实时处理复杂网络。过去针对视频中的每一帧画面,都只能执行图像分类、目标检测、语义分割、实例分割、图像编辑等其中的一种操作;但现在针对每一帧,都能执行以上的所有操作。v8Sednc

到实际应用里,华为现场演示的是视频的实时卡通化:针对一段视频,每一帧都能做轮廓提取、纹理优化和区域分割,并实现每一帧的卡通化。我在现场演示中看到,这个过程的确是完全实时的:通过摄像头拍摄的取景画面就实时呈现出了画面的卡通化——而不是延后处理——以前我们也见过将画面卡通化的app,但那些要么只能处理照片,要么就是对视频有延后处理的长时间等待过程。v8Sednc

另外,除了这种娱乐向的应用,AI视频增强特性中的一个很有意义的应用是将低分辨率的视频upscale成高分辨率——整个过程实现的是每帧画面的去噪、锐化、超分、色彩增强。其中超分,是能够将原画面实现2-3倍的分辨率提升的,比如480p分辨率的视频可以upscale至1080p。起码华为现场演示的效果很不错。v8Sednc

针对一些片源本身就不清楚,或者由于网络环境关系无法观看高分辨率视频的情况,这种在本地将视频“超分”为高分辨率的解决方案是的确能够提升观看体验的。不过这个方案仍然需要第三方播放器做出支持,华为提到后续会在HMS中通过AV Pipeline开放——HMS此前我在介绍HarmonyOS系统时已经提过多次,HMS是可为开发者提供各种Kit和API的一个中间层。v8Sednc

v8Sednc

上面谈的是AI视频处理,接着是AI拍视频。这部分华为宣传的是“业界首次实现ISP+NPU融合架构”。在拍视频时,从摄像头的CIS获取到画面数据,随后进入ISP+NPU的融合结构里,其管线如上图所示。具体数据是如何在NPU与ISP两个硬件之间流动的,就不得而知了——但这两者间一定是有分工的,比如常规的3A(自动白平衡、自动曝光、自动对焦)肯定由ISP执行,而去噪之类的操作可以交给NPU。此前静态照片拍摄,AI如何介入ISP的流程,甚至包括自动白平衡这类传统项亦可由AI单元去完成,谷歌AI Blog就分享过很多这方面的技术细节。v8Sednc

但“首次”实现ISP+NPU的融合,细算起来或许还有其他竞争对手。除了iPhone在照片拍摄时如今也应当有这样的流程;比较具有代表性的是谷歌Pixel手机。v8Sednc

Pixel从二代起加入Pixel Visual Core(或Visual Neural Core),这是个专门用作图像处理的AI硬件——只不过谷歌并不是手机SoC制造商,自己没有能力给手机的主SoC融合一个这样的单元,所以Pixel Visual Core是以独立的形式存在的。理论上它也与ISP做协同,实现Pixel拍照的过程。只不过猜测其时延会比较高(毕竟是芯片间通讯),所以谷歌做画面的AI加强,似乎始终都不曾涉及视频(最多好像也只有动态照片的AI防抖等特性)。v8Sednc

v8Sednc

华为提到,麒麟9000的ISP+NPU处理时间<33ms,就相当于过去单独ISP处理摄像头拍摄的数据一样,这的确算是个性能跨越。值得一提的是,今年麒麟9000的ISP为“Kirin ISP 6.0”,包括3A处理能力的100%提升,以及Quad Pipeline扩张做到处理管线速度50%的提升——这应该也是实现AI视频拍摄整体处理时间<33ms的重要原因。所以ISP与NPU的算力堆砌在此都非常重要,iPhone 12似乎都仍然做不到AI视频拍摄的实时处理。v8Sednc

这一点,华为也专门在演示中做了对比。即iPhone 12 Pro相较Mate 40 Pro,暗光视频拍摄能力,在画面的细节呈现上有差距——这是后者用NPU+ISP协同工作达成的。v8Sednc

另外由于算力的彪悍(与包括system cache在内的通讯的高效),Mate 40也做到了视频的实时4K HDR——这里的实现层级是在SoC之上的ISP与NPU(而非CIS及堆栈的ISP,不过想必索尼CIS的高速读出技术在此也是不可或缺的)。华为宣称是“逆光HDR视频超越人眼”,达到108dB动态范围。v8Sednc

v8Sednc

最后是AI+AR。实际上华为宣传的AI+AR的,本质就是做计算视觉,将手机摄像头看到的世界,通过SLAM(同步定位与地图构建)+语义理解,令AR能够识别周边的东西是什么,并且对对象距离、尺寸做测量——那么无论针对人脸做识别建模,还是对周围环境做识别建模,都能做到实时的感知;感知测量也能达到更高的精度。v8Sednc

艾伟说,“这个功能以前我们用软件来实现,比较耗电,花的时间也比较长。这一次,我们提供专门AR硬化的加速器模块”,“同样一个AR识别,时延降低40ms,功耗降低36mA”。v8Sednc

AI+AR的特性究竟能用来做什么呢?华为设想的是,手机作为信息入口,通过AI+AR,不管是人、物体,还是结构化文字,都能做到实时的识别。且在识别、测量之后,将脱敏的数据传输到云端;云端有海量数据库与知识图谱。于是“它就变成了一个新的陪伴”,“陪伴我们的一个超智慧的感知体验”。未来的一切,从单点对象到整个世界,都可将其实时数字化、识别,并与云端组合到一起。v8Sednc

而此间的传输过程又与5G有着不可分割的关联。v8Sednc

5G:合在一起,打开新世界的大门

在本文最后上价值之前,还是先来看看麒麟9000的5G modem部分。由于麒麟990 5G就已经用上了Balong 5000 modem,所以似乎这次Mate 40系列手机支持5G已经不是新鲜事了。v8Sednc

但华为还是展示了Mate 40一些更为细致的5G数据。包括在sub-6GHz频段下,5G SA下行双载波速率4.6GHz,上行双载波速率2.5GHz,相比骁龙865与A14+X55 modem的方案,理论峰值速率是其2倍(iPhone 12为5G单载波)。不过X55 modem实际上是支持毫米波的,但毫米波的基础设施建设或许就现在看来还没有那么及时:iPhone 12美国版支持毫米波。而实测数据,从华为自己的数据来看,Mate 40与iPhone 12还有更大的差距——这部分还是可以等一等更多评测机构的数据。v8Sednc

v8Sednc

时延部分,上面这张图是在杭州一块区域内的室外测试,绿色部分是指<30ms终端到服务器的时延。这块区域的实测数据是,Mate 40 Pro有84%的在网概率是<30ms时延的,16%的概率时延在30-100ms。而从华为的数据来看,iPhone 12是刚好相反的。实际上,在4G网络之下,100-150ms时延就已经有相对流畅的游戏体验了。因此这也是5G带来的便利。v8Sednc

不过上面这些数据实则并不只是5G modem的问题,可能涉及到了整个RF系统以及天线,乃至手机制造商的系统设计。而且其复杂性之甚,大约还有更多的维度可以探讨。v8Sednc

在5G的问题上,现有5G手机用户普遍的反馈是,没有对应的使用场景,不需要那么高的吞吐与那么低的时延。延续前一个AI+AR的段落,艾伟对此的看法是:以上麒麟9000改进的每一点都有用。v8Sednc

v8Sednc

当它们合在一起的时候,是打开新世界大门的时候。“以今天5G手机的发展速度,经过一个正常的换机周期,两年以后,整个存量市场超过一半会是5G手机——这还是偏保守的数据。那么应用环境变化会自然跟随发生变化。”v8Sednc

“就像4G时,有了3G没有的移动支付、共享经济。到5G时,我们会拥有4G所没有的实时虚拟世界,数字世界与真实世界的结合。”艾伟说,“而且这并不需要太长时间,一定是在两年以内。”看来麒麟9000是为此打下了一个基础。v8Sednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
黄烨锋
欧阳洋葱,编辑、上海记者,专注成像、移动与半导体,热爱理论技术研究。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • MCU上的AI算法在自动驾驶中的实用案例 人工智能(AI)算法和支持硬件对于下一阶段的自动驾驶和最终的自动驾驶实现至关重要,而英飞凌和ZF(德国采埃孚集团)在EEmotion项目中的合作证明了这项雄心勃勃的技术的可行性···
  • AR/VR应用即将迎来爆发,国产高性能SoC已做好准备 从数据存储角度来看,伴随而来的大量数据需要通过“去中心化”进行存储,因此,理想当中的元宇宙背后是各种各样的连接、计算、仿真、人工智能、软件以及区块链这样的技术在做依托。迄今为止,能够连接人和虚拟世界的窗口是AR/VR,但AR/VR设备距离“元宇宙”这个目标还很远。
  • 融合AI算力,进迭时空全球首款8核RISC-V AI CPU面世 过去两年中,进迭时空已经已经完成两款智算核SpacemiT X60和X100的研发工作,并基于SpacemiT X60 智算核心推出全球首颗8核RISC-V AI CPU—SpacemiT Key Stone K1,以及可量产的MUSE系列生态产品。
  • 神经形态计算器件和阵列测试解决方案 神经形态阵列是一种利用忆阻器器件形成的小规模的、实现类似于大脑神经元连接的集成电路。为了探索其应用和优势,有必要开发新的测量技术和模块,对忆阻器器件和阵列进行精确和全面的表征和评估···
  • 放弃造车后,苹果要做家务机器人了 据EDN电子技术设计报道,苹果工程师正致力于开发一种能在家庭环境中自由移动并执行日常任务,如洗碗等家务的机器人。
  • FPGA助力高速未来 FPGA提供无与伦比的灵活性、安全性和高性能,可处理各类复杂任务,包括管理超级高铁网络中的推进、导航和通信等。
  • 如何设计与现场总线无关的智能工厂传感器 这篇博文介绍了智能工厂传感器(温度和压力)的设计理念,无论工厂流程中使用何种类型的现场总线或工业以太网,这些传感器都能与PLC进行通信。
  • 小米SU7首拆:看看主控Orin X、8295芯片到底长啥样 据博主@杨长顺维修家 抖音视频显示,他提车后第一时间拆掉了新车的主控,并在解说中将其与特斯拉做了比较。
  • 继日本台积电晶圆厂之后,先进封装工厂将是下一个目标 日本重启芯片行业的努力很可能再次获得利好:台积电(TSMC)将要建设新的先进封装工厂……
  • Cadence 扩充 Tensilica Vision 产品线,新增毫米波 单个 DSP 用于嵌入式视觉、雷达、激光雷达和 AI 处理,在性能提升的前提下,带来显著的面积优化、功耗和成本的降低;针对 4D 成像雷达工作负载,新增的雷达加速器功能可提供高度可编程的硬件解决方案,显著提升性能;专为多传感器汽车、无人机、机器人和自动驾驶汽车系统设计中的传感器融合处理而设计~
  • 采用芯原NPU IP的AI类芯片已在全球出货超过1亿颗 芯原股份2024年2月29日宣布集成了芯原神经网络处理器(NPU)IP的人工智能(AI)类芯片已在全球范围内出货超过1亿颗,主要应用于物联网、可穿戴设备、智慧电视、智慧家居、安防监控、服务器、汽车电子、智能手机、平板电脑、智慧医疗等10个市场领域。在过去七年里,芯原在嵌入式AI/NPU领域全球领先,其NPU IP已被72家客户用于上述市场领域的128款AI芯片中。
  • 工厂智能化三要素:电源管理IC、处理器和传感器 能源效率是工业4.0的一项主要指令,为的是提高生产力和降低成本,同时减少对环境的影响。智能工厂有赖于一系列元器件——包括电源管理IC(PMIC)、处理器和传感器——来处理监控、收集和分析数据的任务,以确定优化生产流程和降低能耗的最佳方法。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了