Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？-EDN 电子技术设计

 在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。

据ABI Research预计，到2027年全球汽车市场对先进驾驶辅助系统（ADAS）的需求将增长两倍，这对新型汽车创新者、传统整车厂商（OEM）、Tier1供应商，以及汽车系统级芯片（SoC）厂商无疑都是好消息。但汽车行业领导者早已将目光投向了更远的全自动驾驶和自动驾驶出租车（RoboTaxi）。在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。287ednc

想了解ADAS/自动驾驶的最新设计和市场趋势？请即刻报名参加：汽车电子高峰论坛287ednc

287ednc

近日Imagination推出专门面向ADAS和自动驾驶应用的新一代神经网络加速器（NNA）IMG Series4。据称这种AI加速器采用全新的多核架构，可提供高达600 TOPS（每秒万亿次操作）的超高计算性能，并且可为神经网络工作负载提供低带宽和低延迟特性。287ednc

287ednc

Imagination视觉和人工智能部门高级总监Andrew Grant列举出IMG Series4的五大特性：287ednc

多核扩展和灵活性：全新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步。Imagination软件可提供精细的控制能力，可通过对多个工作负载进行批处理、拆分和调度而提高灵活性。Series4可为每个集群配置 2个、4个、6个或者8个内核。
超高性能：Series4单核能够以不到1W的功耗提供12.5 TOPS的性能，比如一个8核集群可以提供100 TOPS的算力，那么若配置6个这种8核集群就可以提供高达600 TOPS的算力，足以满足Level 5完全自动驾驶所需要的500 TOPS。在AI推理方面，Series4 NNA的性能比嵌入式GPU快20倍以上，而比嵌入式CPU快1000倍。
超低延迟：将多个内核组成2核、4核、6核或8核的多核集群，所有内核可以相互协作，并行处理一个任务，从而降低处理延迟，缩短响应时间。例如，对于一个8核集群，理想情况下延迟会减少至单核独立执行时的1/8。
节省带宽：Imagination在Series4中新增了Tensor Tiling（ITT）技术，可以对计算任务进行瓦面平铺（tiling），充分利用片上存储来提升数据处理效率，并节省访问外部存储的带宽。ITT利用本地数据的依赖性将中间数据保存在片上存储器中，这样可以最大限度地减少将数据传输至外部存储器，从而大大降低带宽，多达90％。ITT是一种可扩展的算法，在拥有大量输入数据的网络上具有显著优势。
车规级安全性：Series4包含IP级别的安全功能，而且其设计流程符合汽车电子行业安全标准ISO 26262。在不影响性能的前提下，Series4可以安全地进行神经网络推理。其硬件安全机制可以保护编译后的网络、网络执行和数据处理管道。

Andrew Grant认为，Series4 NNA将会成为开发ADAS和自动驾驶汽车的行业标准平台。一些行业创新者已经在着手打造支持下一代ADAS功能和自动驾驶的系统级芯片，这一AI加速平台将为他们提供算力、功耗、带宽和延迟等方面的最佳组合性能。287ednc

多核集群实现性能线性提升

随着汽车电子从数字驾驶舱/人机界面（HMI）向ADAS和自动驾驶的演讲，在保证安全性和可靠性的同时，对处理性能要求越来越高。比如，Level 2级别的驾驶员监测功能只需要10 TOPS的算力即可处理，而Level 3-4级别的自动泊车功能就需要100 TOPS性能。要实现Level 5级别的完全自动驾驶，必须有500 TOPS以上的算力支持才行。287ednc

287ednc

Series4 NNA采用全新的内核架构，每个内核具有12.5 TOPS性能。若基于5nm工艺节点，8个内核的集群可提供： 100 TOPS的算力性能；30 TOPS/Watt 的性能功耗比；12 TOPS/mm^2 的性能密度；低延迟处理大量输入数据。287ednc

287ednc

由4 个内核组成的 50 TOPS 集群能够跨整个集群拆分各层，比如支持并行处理大型网络的各层；减少整体延迟，特别是在拥有大尺寸输入层的网络上。而各内核能够独立运行，可以共同执行一个批处理任务，也可以分别运行各自不同的网络。此外，这种4内核集群可以作为基础模块进行算力扩展。比如，4个50 TOPS集群就可以构成一个200 TOPS的多集群引擎。3个这种多集群引擎组合起来，就可以达到600 TOPS的算力性能，满足Level 5自动驾驶算力要求。287ednc

287ednc

张量平铺(Tensor Tiling)技术

Imagination产品管理部门总监Gilberto Rodriguez对Series4新增的张量平铺（Tensor Tiling, ITT）技术做了详细介绍。网络的多层是以融合内核的形式在加速器硬件流水线里运行的，而融合内核之间的特征图需要通过外部存储进行交换。在不采用ITT技术的情况下，内核需要频繁的DDR存取，因此会占用很大的带宽。287ednc

287ednc

若采用了ITT技术，就可以充分利用紧耦合的 SRAM 来融合更多的层，减少需要通过外部存储交换的特征图，从而降低带宽需求。287ednc

287ednc

结语

ADAS和自动驾驶虽然呼声很高，但仍然难以商用落地。究其原因，严苛的安全性和极高的算力和即时处理决策要求对汽车厂商及其供应商提出了很大的挑战。素以GPU内核著称的Imagination技术公司开始发力AI加速器市场，最新发布的Series 4 NNA专为ADAS/自动驾驶应用而设计。虽然其多核集群架构可以提供高达600 TOPS的算力性能，但能否真正满足完全自动驾驶的性能需求，还要看基于这种AI加速器内核的芯片和系统开发，真正应用到自动驾驶实际场景中能否胜任还需要市场的检验。287ednc

责编：Amy Ｇuan287ednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

顾正书

电子工程专辑（EETimes China）主分析师

进入专栏

自动驾驶汽车电子人工智能产业前沿

上一篇： 对比英飞凌与比亚迪，看国产汽车半导体面临的挑战与发展机遇 下一篇： 使用标准稳压器产生极低电压

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

思特威正式发布子品牌飞凌微，首发产品定位智驾视觉处理思特威（上海）电子科技股份有限公司（股票简称：思特威，股票代码：688213）正式发布全资子公司品牌——飞凌微电子（Flyingchip™，以下简称“飞凌微”)。同时，飞凌微M1车载视觉处理芯片系列正式亮相，包括M1(Camera ISP)以及M1Pro(Camera SoC)和M1Max(Camera SoC)。
儒卓力系统解决方案推出RAB4新型适配器板，实现厘米级精儒卓力系统解决方案 (Rutronik System Solutions) 的专家与儒卓力无线技术中心 (Rutronik Wireless Competence Center) 携手开发了RAB4适配器板，无需设计任何硬件即可测试 RTK 性能，从而加速预开发阶段并降低成本，帮助客户更快地将应用推向市场……
自动驾驶：挑战与机遇尽管ADAS系统正加速发展，但距离实现自动驾驶还有几大步骤有待完成，在真正的自动驾驶成为现实之前，还有许多技术和监管障碍需要跨越。
CEVA和Autotalks扩大合作连手创建全球首个5G-V2X解决 Autotalks推出CEVA助力的最新V2X芯片TEKTON3和SECTON3已获主要汽车OEM厂商准予批量生产。
坚持不懈的身影：Intel自动驾驶事业群副总裁Kathy Winte “不要永远只做擅长的事情，要延展自己的能力；尝试不熟悉的东西、学习新的技术领域或是市场，如此就能有所成长并能掌握更多新机会。”
汽车ADAS需要EMI/EMC辐射很低的开关转换器 ADAS系统在新型汽车中的应用越来越广泛。找到一种不对ADAS系统造成干扰的电源转换器件，能够极大地简化设计师的任务，同时无需复杂的布局或设计方法，就可为设计师提供需要的所有性能。
一组图表说清自动驾驶汽车的前世今生与未来众所周知，自动驾驶汽车是汽车行业的新宠，但自动驾驶汽车并不是21世纪才出现的。在1939年纽约的世界博览会上，美国通用汽车公司（GM）的Futurama首次向世人展示了对未来自动驾驶的构想，这是世界关于自动驾驶汽车的最早记录。可以说，GM是自动驾驶的鼻祖。本文的一组图表生动地呈现了自动驾驶汽车的前世、今生与未来。
5G如何改变数据中心即将提供的基于5G网络技术的数据服务将可更快地在线访问更多数据。信息的这种即时性将支持许多当今先进的技术应用——如自主驾驶汽车和虚拟现实或增强现实系统——以省去本地存储的数据并转而依赖于云。为使其发挥效率，网络延迟需要小于1ms。这不仅需要在数据中心安装5G基础设施，还要求数据中心同时靠近用户及为其服务的蜂窝射频发射塔——而如果数据中心远在250英里外则会鞭长莫及！
最近五年黑客从哪些方面对网联自动驾驶汽车进行了攻击《速8》上映如火如荼，其中百辆自动驾驶汽车被黑的场面让人印象深刻。外行看热闹，内行看门道，这无疑给风头正劲的自动驾驶的安全问题再次敲响了警钟。那么，五年来黑客都从哪些方面对网联自动驾驶汽车进行了攻击？
利用MEMS扫描镜技术提高汽车安全性业界对用于ADAS的激光雷达技术趋之若骛。这是业内的热门话题，很多大公司都想从中分得一杯羹。英飞凌去年通过收购Innoluce获得了激光雷达专用技术。ADI公司也从Vescent Photonics公司收购了LBS技术，以支持主流汽车激光雷达系统的普及。未来必将有更多同类的收购案发生，使这个市场火热起来。
基于SoC的双目视觉ADAS解决方案相比于单目视觉，双目视觉（Stereo Vision）的关键区别在于可以利用双摄像头从不同角度对同一目标成像，从而获取视差信息，推算目标距离。
毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？

多核集群实现性能线性提升

张量平铺(Tensor Tiling)技术

结语