广告

英伟达:超级算力赋能整车中央计算

2023-06-12 16:04:35 夏菲 阅读:
现在很多新势力厂商已把全车做到10个以下的域控制器,甚至能实现比以前传统厂商更多的功能。随着域控制器的数量的进一步减少,其功能也将越来越复杂,对单个域控制器的性能也将提出更高的挑战。

在汽车智能化,网联化发展的需要下,传统分布式的架构零散的电子控制器(Electronic Control Unit, ECU)布局逐渐向集中式架构演进,“域”和“域控制器”产生,以前可能是一个域控制器负责一个或者两个功能,但现在很多新势力厂商已把全车做到10个以下的域控制器,甚至能实现比以前传统厂商更多的功能。随着域控制器的数量的进一步减少,其功能也将越来越复杂,对单个域控制器的性能也将提出更高的挑战。Pt6ednc

Pt6ednc

英伟达半导体解决方案经理贺威Pt6ednc

 6月8日,在由AspenCore主办的2023国际AIoT生态发展大会智能网联汽车分论坛上,英伟达半导体解决方案经理贺威先生分享了英伟达在框架融合和中央计算趋势下做的一些应对和布局。Pt6ednc

分布式向集中式演进大势所趋

据介绍,英伟达第一代车端SOC叫Parker,这一代并没有大规模量产的案例,更多的是拿来做系统验证或者打通前端的数据采集,甚至有的用户拿来做开发版。第二代叫Xavier,有一些大规模量产的案例,属于比较成熟的方案。第三代则是目前在国内占据主流的Orin。Pt6ednc

Pt6ednc

ORIN芯片参数如下:Pt6ednc

  • 24.5 billion transistors
  • 12 A78 (Hercules) ARM64 CPUs
  • 254 INT8 TOPS - CUDA Tensor Core GPU + DLA 
  • 205 GB/s memory bandwidth
  • 4 10Gbps ENET
  • 8K 30 Dec | 4K 60 Enc – H264 / H265 / VP9
  • 4 R52 Lock-step Pairs Integrated Safety Island ASIL-D
  • Secure key storage
  • FUSA ASIL-B Chip | ASIL-D Systematic

据贺威介绍,英伟达GPU的灵活性众所周知,对于深度学习和神经网络非常友好,但将其放在车端或者移动端,灵活性就需要牺牲能耗来实现,因此提供了专门针对特定神经网络的DLA引擎,并进行了算法优化,使其灵活的同时,具有很高的性能功耗比,同时也提供了非常易用的接口给到用户。Pt6ednc

ORIN上还有比较高内存的带宽,提供了很好的连接性,如以太网的接口。同时还有大量的硬件加速引擎,如编解码加速引擎,图像引擎等。并提供了PBA加速引擎,用户可以把一些比较简单的算法部署在这上面,同时引入了车规级的安全岛Safety Island模块。Pt6ednc

贺威:“从前年开始已有大量中国厂商采用ORIN的设计,各家方案不一样,有的采用一颗ORIN,有的可能采用两颗甚至四颗更多。ORIN也提供了芯片之间互联的能力,以此给用户提供更多的性能上的冗余。现在的汽车大家都说是软件定义汽车,如果在预埋足够算力的硬件之后,后期可以通过软件不停地做升级,以此来让用户获得更多功能上的体验。”Pt6ednc

据NVIDIA官网介绍,英伟达下一代车端SOC Thor,预计明年推出,在算力上将实现非常大的提升,DRIVE Thor 将逐步接替 DRIVE Orin,以最新的计算技术,加速智能汽车技术在行业内的部署,赋能汽车制造商的 2025 年车型。Pt6ednc

Thor参数如下:Pt6ednc

  • 77B transistors
  • 2000 TFLOPS performance with FP8 precision
  • Leverages Hopper GPU, Ada GPU, and Grace CPU
  • Integrates Transformer Engine for accelerated inference
  • Multi-domain computing: Linux, QNX, Android
  • NVLINK-C2C scalability
  • Eases supply constraints, simplifies car E/E design
  • Lowers weight, cabling, footprint, costs

据官网介绍,DRIVE Thor 也是首个采用推理 Transformer 引擎的NVIDIA自动驾驶汽车平台。Transformer 引擎是 NVIDIA GPU Tensor Core 的一个全新组件。Transformer 网络将视频数据作为单个感知帧来处理,使计算平台能够随着时间的推移具有处理更多数据的能力。Pt6ednc

此外,DRIVE Thor能够进行多域计算,这意味着它可以将自动驾驶、车载信息娱乐等功能划分为不同的任务区间,同时运行,互不干扰。DRIVE Thor芯片也可以让车辆所有的显示器、传感器等都连接到单一芯片上,极大地简化了汽车制造的复杂程序,这也是汽车电子电气架构从分布式向集中式演进的大势所趋。Pt6ednc

软件加持最大化释放硬件潜能

贺威认为,硬件只是实现高算力高性能的一方面,把硬件的潜能做到最大化的释放,还需要软件的加持。Pt6ednc

英伟达针对车载加速计算推出了安全操作系统DRIVE OS。据英伟达官网介绍,DRIVE OS是一个基础软件栈,由嵌入式实时操作系统 (RTOS)、NVIDIA Hypervisor、NVIDIA® CUDA® 库,以及可让您访问硬件引擎的其他模组组成。DRIVE OS 为安全启动、安全服务、防火墙和无线 (OTA) 更新等应用程序提供安全可靠的执行环境。Pt6ednc

官网详细信息:Pt6ednc

  • 多个客户机操作系统
  • 64 位用户空间和运行时库
  • 用于硬件加速多媒体和摄像头输入处理的 NvMedia API
  • CUDA 并行计算平台
  • 图形 API:OpenGL、OpenGL ES、支持 EGLStream 扩展程序的 EGL
  • 深度学习库:TensorRT、cuDNN

贺威:“DRIVE OS的核心是一套虚拟化的平台,可兼容不同的OS,不同于其他厂商,DRIVE OS是英伟达自己做的方案,它提供了对英伟达SOC平台上资源的隔离,同时保证了各个不同计算阈的要求,如有些计算阈实时性要求比较高,QS要求也比较高,有些阈对渲染的需求更大,利用DRIVE OS这套虚拟化平台,我们会针对英伟达的SOC做最大的优化,它所引入的性能、损耗几乎可以忽略不计。同时又能很好地做资源的隔离,很好地适配我们的SOC。”Pt6ednc

当说到算力时,经常会有一些评测,或者理论指出英伟达某款芯片性能被“吊打”,但贺威强调:“不要只关注这个芯片有多少计算能力,英伟达关注的是从软件上怎么去充分地释放提供硬件的能力,同时怎么给用户以最好的体验,让开发者和终端用户真正便捷地享受算力提升带来的好处。”Pt6ednc

据贺威介绍,英伟达在软件方面针对整个DRIVE OS做的各个模块,构成了从车端到云端的一整套生态链,他认为,英伟达的护城河不只是高算力,还有这套生态链。贺威:“从横向上来看,嵌入式、车端、云端都可使用这一套虚拟平台,纵向上来看,从第一代刚开始提出,到英伟达加入车载领域之后,包括虚拟化解决方案和SDK,英伟达一直在使用这套虚拟平台。并且在未来,英伟达还会持续对硬件和软件进行优化。”Pt6ednc

责编:Demi
夏菲
Aspencore助理产业分析师,专注行业市场前沿及技术发展趋势。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 将锂金属电池寿命提高750%,竟然只需要“水”? 随着新能源汽车、移动设备等领域的快速发展,高性能电池的需求日益旺盛,锂金属作为新一代阳极材料,因具有高能量密度、轻量化等优点,备受关注。然而,锂金属电池所存在的寿命短、易起火或爆炸等问题,限制了其广泛的商业应用···
  • 按下ON还是按住OFF,将这种开关电路升级到交流电 2024年10月14日,Nick Cornford发布了一个名为“按下去再按上来,这种开关有哪些门道?”的设计实例(DI)。对于直流电压来说,这是一个非常有趣的DI,但对于交流电压呢?
  • 协同创新,助汽车行业迈向电气化、自动化和互联化的未来 汽车行业正处在电动化和智能化的转型过程中,而半导体企业站在这一变革的最前沿。这一转型带来了重大发展机遇,也带来了诸多挑战,需要颠覆性的技术以及更短的开发周期。加强半导体制造商、一级供应商和汽车制造商之间的合作,对于应对这些复杂情况及推动行业迈向电气化、自动化和互联化的未来至关重要···
  • 将单电源单端输入改成伪A/B类差分输出放大器 该放大器采用Barrie Gilbert的微混频器拓扑结构可将单端输入转换为单电源A/B类电流输出···
  • 加强低功耗FPGA的领先地位 在快速发展的技术领域,从以云端为中心到以网络边缘为中心的创新转变正在重塑数据的处理和利用方式···
  • 打造下一代家用机器人:精心构建智能化、集成化和电源优 ​​​​​​​今天的家用机器人不仅仅是工具,它们已经成为人们的生活伙伴,为日常生活增添了便利性和互动性。设计这些结构紧凑、功能强大的机器需要克服连接性、电源和外形尺寸等方面的严峻挑战,每一次突破都使我们更接近全面集成的智能家居体验···
  • 用LM337改造,让PWM DAC获得1.5 A输出能力 DAC是一种低功耗设备,其功率和电流输出能力仅限于毫瓦和毫安范围。当然,从根本上讲,它们没有理由不与合适的功率输出级配合使用,这确实也是常见的实际做法。不过,为了好玩,这个设计实例采用了不同的供电方式···
  • 意法半导体:让可持续世界从概念变为现实 最近,意法半导体人力资源和企业社会责任总裁Rajita D’Souza分享了意法半导体的可持续发展战略和近期工作重点···
  • 如何制作双变频的航空波段接收机? 随着互联网的发展,中波和短波频段的接收机已成为过去式,更不用说长波了。不过也许在无线电领域中最有趣的活动之一就是收听服务发射机,对于我这个与航空相关的人来说,主要指的是飞机的发射机和空中交通管制塔···
  • 用4200A和矩阵开关搭建自动智能的可靠性评估平台 在现代ULSI电路中沟道热载流子(CHC)诱导的退化是一个重要的与可靠性相关的问题···
  • 新一代MCU向着边缘AI和实时控制发展 在工业和汽车领域,电机驱动和数字电源转换是典型的实时控制系统,要求处理器具有高实时性和强大的数学计算与处理能力。这些应用需要优质的ADC和PWM功能,并通过联动机制,形成高效、有机的实时控制系统。
  • 英特尔Ultra处理器,用普通内存也能超频到10000 MT/s+? 目前内存超频的世界记录是12666MT/s,而想要达成这样的频率不光需要降低CPU频率,还需要辅助液氮等特殊的冷却方案,对内存进行降温。但已有主板可以在没有特殊冷却方案的情况下,超频到10000 MT/s以上···
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了