广告

Level 5自动驾驶需要500+TOPS算力,IMG Series4多核集群AI加速器能否胜任?

2020-11-18 16:36:52 顾正书 阅读:
在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中,神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景,比如从多个摄像头和激光雷达的传感器融合中提取数据,以实现自动泊车、十字路口管理,以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。

据ABI Research预计,到2027年全球汽车市场对先进驾驶辅助系统(ADAS)的需求将增长两倍,这对新型汽车创新者、传统整车厂商(OEM)、Tier1供应商,以及汽车系统级芯片(SoC)厂商无疑都是好消息。但汽车行业领导者早已将目光投向了更远的全自动驾驶和自动驾驶出租车(RoboTaxi)。在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中,神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景,比如从多个摄像头和激光雷达的传感器融合中提取数据,以实现自动泊车、十字路口管理,以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。FpPednc

想了解ADAS/自动驾驶的最新设计和市场趋势?请即刻报名参加:汽车电子高峰论坛FpPednc

FpPednc

近日Imagination推出专门面向ADAS和自动驾驶应用的新一代神经网络加速器(NNA)IMG Series4。据称这种AI加速器采用全新的多核架构,可提供高达600 TOPS(每秒万亿次操作)的超高计算性能,并且可为神经网络工作负载提供低带宽和低延迟特性。FpPednc

FpPednc

Imagination视觉和人工智能部门高级总监Andrew Grant列举出IMG Series4的五大特性:FpPednc

  1. 多核扩展和灵活性:全新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步。Imagination软件可提供精细的控制能力,可通过对多个工作负载进行批处理、拆分和调度而提高灵活性。Series4可为每个集群配置 2个、4个、6个或者8个内核。
  2. 超高性能:Series4单核能够以不到1W的功耗提供12.5 TOPS的性能,比如一个8核集群可以提供100 TOPS的算力,那么若配置6个这种8核集群就可以提供高达600 TOPS的算力,足以满足Level 5完全自动驾驶所需要的500 TOPS。在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,而比嵌入式CPU快1000倍。
  3. 超低延迟:将多个内核组成2核、4核、6核或8核的多核集群,所有内核可以相互协作,并行处理一个任务,从而降低处理延迟,缩短响应时间。例如,对于一个8核集群,理想情况下延迟会减少至单核独立执行时的1/8。
  4. 节省带宽:Imagination在Series4中新增了Tensor Tiling(ITT)技术,可以对计算任务进行瓦面平铺(tiling),充分利用片上存储来提升数据处理效率,并节省访问外部存储的带宽。ITT利用本地数据的依赖性将中间数据保存在片上存储器中,这样可以最大限度地减少将数据传输至外部存储器,从而大大降低带宽,多达90%。ITT是一种可扩展的算法,在拥有大量输入数据的网络上具有显著优势。
  5. 车规级安全性:Series4包含IP级别的安全功能,而且其设计流程符合汽车电子行业安全标准ISO 26262。在不影响性能的前提下,Series4可以安全地进行神经网络推理。其硬件安全机制可以保护编译后的网络、网络执行和数据处理管道。

Andrew Grant认为,Series4 NNA将会成为开发ADAS和自动驾驶汽车的行业标准平台。一些行业创新者已经在着手打造支持下一代ADAS功能和自动驾驶的系统级芯片,这一AI加速平台将为他们提供算力、功耗、带宽和延迟等方面的最佳组合性能。FpPednc

多核集群实现性能线性提升

随着汽车电子从数字驾驶舱/人机界面(HMI)向ADAS和自动驾驶的演讲,在保证安全性和可靠性的同时,对处理性能要求越来越高。比如,Level 2级别的驾驶员监测功能只需要10 TOPS的算力即可处理,而Level 3-4级别的自动泊车功能就需要100 TOPS性能。要实现Level 5级别的完全自动驾驶,必须有500 TOPS以上的算力支持才行。FpPednc

FpPednc

Series4 NNA采用全新的内核架构,每个内核具有12.5 TOPS性能。若基于5nm工艺节点,8个内核的集群可提供: 100 TOPS的算力性能;30 TOPS/Watt 的性能功耗比;12 TOPS/mm^2 的性能密度;低延迟处理大量输入数据。FpPednc

FpPednc

由4 个内核组成的 50 TOPS 集群能够跨整个集群拆分各层,比如支持并行处理大型网络的各层;减少整体延迟,特别是在拥有大尺寸输入层的网络上。而各内核能够独立运行,可以共同执行一个批处理任务,也可以分别运行各自不同的网络。此外,这种4内核集群可以作为基础模块进行算力扩展。比如,4个50 TOPS集群就可以构成一个200 TOPS的多集群引擎。3个这种多集群引擎组合起来,就可以达到600 TOPS的算力性能,满足Level 5自动驾驶算力要求。FpPednc

FpPednc

张量平铺(Tensor Tiling)技术

 Imagination产品管理部门总监Gilberto Rodriguez对Series4新增的张量平铺(Tensor Tiling, ITT)技术做了详细介绍。网络的多层是以融合内核的形式在加速器硬件流水线里运行的,而融合内核之间的特征图需要通过外部存储进行交换。在不采用ITT技术的情况下,内核需要频繁的DDR存取,因此会占用很大的带宽。FpPednc

FpPednc

若采用了ITT技术,就可以充分利用紧耦合的 SRAM 来融合更多的层,减少需要通过外部存储交换的特征图,从而降低带宽需求。FpPednc

FpPednc

结语

ADAS和自动驾驶虽然呼声很高,但仍然难以商用落地。究其原因,严苛的安全性和极高的算力和即时处理决策要求对汽车厂商及其供应商提出了很大的挑战。素以GPU内核著称的Imagination技术公司开始发力AI加速器市场,最新发布的Series 4 NNA专为ADAS/自动驾驶应用而设计。虽然其多核集群架构可以提供高达600 TOPS的算力性能,但能否真正满足完全自动驾驶的性能需求,还要看基于这种AI加速器内核的芯片和系统开发,真正应用到自动驾驶实际场景中能否胜任还需要市场的检验。FpPednc

责编:Amy GuanFpPednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
顾正书
电子工程专辑(EETimes China)主分析师
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 思特威正式发布子品牌飞凌微,首发产品定位智驾视觉处理 思特威(上海)电子科技股份有限公司(股票简称:思特威,股票代码:688213)正式发布全资子公司品牌——飞凌微电子(Flyingchip™,以下简称“飞凌微”)。同时,飞凌微M1车载视觉处理芯片系列正式亮相,包括M1(Camera ISP)以及M1Pro(Camera SoC)和M1Max(Camera SoC)。
  • 儒卓力系统解决方案推出RAB4新型适配器板,实现厘米级精 儒卓力系统解决方案 (Rutronik System Solutions) 的专家与儒卓力无线技术中心 (Rutronik Wireless Competence Center) 携手开发了RAB4适配器板,无需设计任何硬件即可测试 RTK 性能,从而加速预开发阶段并降低成本,帮助客户更快地将应用推向市场……
  • 自动驾驶:挑战与机遇 尽管ADAS系统正加速发展,但距离实现自动驾驶还有几大步骤有待完成,在真正的自动驾驶成为现实之前,还有许多技术和监管障碍需要跨越。
  • CEVA和Autotalks扩大合作连手创建全球首个5G-V2X解决 Autotalks推出CEVA助力的最新V2X芯片TEKTON3和SECTON3已获主要汽车OEM厂商准予批量生产。
  • 坚持不懈的身影:Intel自动驾驶事业群副总裁Kathy Winte “不要永远只做擅长的事情,要延展自己的能力;尝试不熟悉的东西、学习新的技术领域或是市场,如此就能有所成长并能掌握更多新机会。”
  • 汽车ADAS需要EMI/EMC辐射很低的开关转换器 ADAS系统在新型汽车中的应用越来越广泛。找到一种不对ADAS系统造成干扰的电源转换器件,能够极大地简化设计师的任务,同时无需复杂的布局或设计方法,就可为设计师提供需要的所有性能。
  • 一组图表说清自动驾驶汽车的前世今生与未来 众所周知,自动驾驶汽车是汽车行业的新宠,但自动驾驶汽车并不是21世纪才出现的。在1939年纽约的世界博览会上,美国通用汽车公司(GM)的Futurama首次向世人展示了对未来自动驾驶的构想,这是世界关于自动驾驶汽车的最早记录。可以说,GM是自动驾驶的鼻祖。本文的一组图表生动地呈现了自动驾驶汽车的前世、今生与未来。
  • 5G如何改变数据中心 即将提供的基于5G网络技术的数据服务将可更快地在线访问更多数据。信息的这种即时性将支持许多当今先进的技术应用——如自主驾驶汽车和虚拟现实或增强现实系统——以省去本地存储的数据并转而依赖于云。为使其发挥效率,网络延迟需要小于1ms。这不仅需要在数据中心安装5G基础设施,还要求数据中心同时靠近用户及为其服务的蜂窝射频发射塔——而如果数据中心远在250英里外则会鞭长莫及!
  • 最近五年黑客从哪些方面对网联自动驾驶汽车进行了攻击 《速8》上映如火如荼,其中百辆自动驾驶汽车被黑的场面让人印象深刻。外行看热闹,内行看门道,这无疑给风头正劲的自动驾驶的安全问题再次敲响了警钟。那么,五年来黑客都从哪些方面对网联自动驾驶汽车进行了攻击?
  • 利用MEMS扫描镜技术提高汽车安全性 业界对用于ADAS的激光雷达技术趋之若骛。这是业内的热门话题,很多大公司都想从中分得一杯羹。英飞凌去年通过收购Innoluce获得了激光雷达专用技术。ADI公司也从Vescent Photonics公司收购了LBS技术,以支持主流汽车激光雷达系统的普及。未来必将有更多同类的收购案发生,使这个市场火热起来。
  • 基于SoC的双目视觉ADAS解决方案 相比于单目视觉,双目视觉(Stereo Vision)的关键区别在于可以利用双摄像头从不同角度对同一目标成像,从而获取视差信息,推算目标距离。
  • 没有优质探头,示波器 ADC 分辨率再高也无意义 为了实现准确的信号测量,示波器必须通过探头连接到被测电子电路。探头发挥着重要作用,能够确保到达示波器的信号无杂质、不失真,且尽可能接近电路中流通的原始信号···
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了