芯片,“左右”未来智能汽车的变革速度。而数据处理效率以及安全保障,对于新的电子架构、自动驾驶等等至关重要。最近Arm发布了三款芯片,面向自动驾驶车辆的高强度工作负载。
Arm近日发布了几款全新的IP,旨在让智能汽车开发商更容易将他们的设计方案推向量产市场。据该公司介绍,三种新处理器IP将集成到一个系统芯片上——Arm Cortex-A78AE处理器、Mali-G78AE图形处理器和Mali-C71AE图像信号处理器。
Arm表示,Cortex-A78AE、Mali-G78AE和Mali-C71AE是现有的Cortex-A78、Mali-G78和Mali-C71的高阶版本,面向自动驾驶车辆的高强度工作负载。
在软件开发支持方面,Arm提供了Arm Fast Models,可用于构建功能精确的虚拟平台,使软件开发和验证先于硬件可用性。还有Arm Development Studio,其中包括由德国TUV SUD认证的Arm编译器。
这些新产品方案的推出,目的是为了提供更高效和安全的数据处理,以实现自主决策的效率、安全和潜力。
尽管,完全自动驾驶车辆或无人驾驶汽车可能还需要数年时间才能投入商用,但先进的驾驶辅助系统(ADAS)已经可以帮助减少多达40%的事故。
Arm汽车和物联网副总裁Chet Babla表示,新技术将安全放在首位,但也提供了能效和性能提升。
Cortex-A78AE是Cortex-A76AE的后续产品,其微架构已经在多个方面进行了改进。它的特点是额外的带宽,改进的分支检测,以及比上一代带宽高50%的内存子系统。
但是Cortex-A78AE最突出的特性可能是宏操作缓存,这种结构设计用于保存解码指令,解耦获取引擎和执行,以支持动态代码序列优化。
Arm表示,这些创新使得整型和浮点计算的性能比Spec2006综合基准套件提高了30%以上。此外,它们还有助于提高Cortex-A78AE的功率效率。
在7纳米器件上,Cortex-A78AE以低60%的功率实现了目标性能,在相同的功率(耗电量)下性能提高了25%。
此次,Arm将Cortex-A78AE的安全特性作为主要进步进行重点“宣传”。
当Cortex-A76AE引入Split-Lock架构时,它被视为安全计算新时代的诞生。及时检测逻辑中的故障对解决行业标准(如ISO 26262/IEC 61508)规定的功能性安全问题大有帮助。
但是新的架构带来了新的挑战——可用性、ASIL B支持和全系统功能安全性。Cortex-A78AE通过一系列的安全功能直面这些挑战。
首先,Arm通过增加时间多样性来增强原来的锁步能力,以防止常见原因的故障,这是一个很小但非常重要的增加。
除了拆分模式操作之外,还增强了混合模式——这是一种进步,允许共享的DSU-AE逻辑在锁模式下继续运行,而cpu保持独立(拆分)。
这样做的好处有两方面:
1、在FMEDA中,DSU-AE计数对诊断覆盖率的额外覆盖;2、cpu可以单独离线进行测试,而集群本身仍可用于计算,尽管计算能力有所降低。
此外,标准的安全措施,如缓存保护逻辑在Cortex-A78AE中仍然是强制性的,可用性进一步增强,增加了线锁定支持,以避免触及缓存结构中的错误位置。
最后,Cortex-A78AE带有AMBA奇偶性保护功能,它的架构与AE IP组合套件一起工作。这是一种简单且有效的方式,可以在SoC的其余部分扩展功能安全保护伞,从而实现端到端(E2E)保护能力的目标。
此外,Cortex-A78AE可以在处理器集群中扩展到最多4个核,并且可以在L1、L2和L3中使用不同大小的缓存。
尽管Cortex-A78AE的性能令人印象深刻,但汽车及工业领域的计算平台需要混合功率效率、算法强度和直接计算吞吐量。
正确大小的计算是当今的口号。简单地说,没有一个微体系结构能够满足这些细分市场的应用程序需求。
例如,一个自动驾驶平台需要在使用车辆控制之前感知数据、感知障碍物并决定正确的路径矢量。只有中间的两个任务,需要大量不同的算法来执行。
为此,除了内存接口和类型之外,CPU还支持以各种缓存大小(L1、L2和L3)进行配置。比如,Cortex-A78AE可以与Cortex-A65AE在异质计算集群中配对,并且可以通过加速器相干端口与加速器耦合。
这种新的混合模式允许分割锁功能,其中处理器成对运行,在不影响性能的情况下满足较低级别的安全要求,而SoC计算体系结构也可以部署到不同的域控制器上。
与Cortex-A78AE互补的是最新推出的Mali-G78AE,这是一个全新的图形组件,可以解决自动驾驶系统中的异构计算需求。
G78AE GPU提供了一种新的资源分配方法,它具有一种称为灵活分区的特性,这使得图形资源可以专用于不同的工作负载,同时保持彼此独立。
基本上,Mali-G78AE可以被分割成一个系统中的多个GPU,有多达4个用于工作负载分离的专用分区,这些分区可以使用用于事务的单独内存接口分别上机、关机和复位。
Mali-G78AE可以从1个shader core扩展到24个,在新的架构中,这意味着可以按照8个slices配置,每个slices有三个shader core。
每个slices有独立的内存接口、工作控制和L2缓存,以确保分离的功能安全和信息安全,slices也可以组合在一起,在多达四个分区可配置软件。
Mali-G78AE还包括专用的硬件虚拟化,这意味着GPU作为一个整体(即每个单独的分区)可以在多个虚拟机之间进行虚拟化。
除此之外,它还具有安全特性,包括锁步、内置自测试、接口奇偶校验、隔离检查和只读内存保护。
新Mali-G78AE GPU为独立的安全工作负载提供了多达4个独立分区的灵活分区。例如,汽车上的信息娱乐系统、具有安全要求的仪表和驾驶员监控系统现在都可以通过硬件分离同时独立运行。
Mali-C71AE,利用硬件安全机制和诊断软件来预防和检测故障,并确保“每一个像素的可靠性”。
Arm表示,事实上,Mali-C71AE是Mali相机系列ISPs中首款内置安全功能的产品。同时,支持ASIL B/SIL 2安全能力,提供1.2千兆像素/秒的吞吐量。
Mali-C71AE支持最多4个实时摄像头输入或者16个来自内存的摄像头数据流。相机输入可以用多种方法进行处理,包括按接收顺序、按编程顺序或按各种其他软件定义的模式。
先进的空间降噪、每次曝光噪声分析和色差校正为计算机视觉应用提供了优化的数据,为ADAS和人机界面应用提供了实时安全功能,使系统级功能安全符合400多个专用故障检测电路和内置自检。
此外,Mali-C71AE具有超宽动态范围的24位处理,提供了独立的动态范围管理、感兴趣的区域操作和用于进一步分析的平面直方图。
最新消息,上述新的Cortex CPU将在下一代Nvidia Orin SoC中为边缘AI提供先进的性能和安全性。