目前,人工智能(AI)风头正劲。各种应用领域都有应用AI的方案,但是其中许多方案中的AI应用都取决于云端的计算能力,而在嵌入式系统领域并不具备可以随时自由连接云端的环境。即便是可以连接到云,也会因云端反馈所带来的延迟而无法满足嵌入式系统对实时性的高要求。此外,对于电池供电类应用,我们希望功耗越低越好,但目前一般的低功耗技术,只能在运行和待机模式中择一保持低功耗,这就无法满足系统长时间工作的要求。面对上述这两个挑战,瑞萨电子(Renesas)推出了两种前沿科技——e-AI(嵌入式人工智能解决方案)和SOTB(薄氧化埋层覆硅)。日前,瑞萨电子在其CITE展会同期举办的媒体发布会上为我们做了详细解读。
瑞萨电子株式会社高级副总裁、瑞萨电子中国董事长真冈朋光表示,瑞萨电子正在为工厂自动化推出e-AI嵌入式人工智能解决方案,并为物联网应用研发SOTB超低功耗工艺。
目前,设备端、云端、大数据、物联网相辅相成,支持着智能化世界的快速发展。而瑞萨电子也为智能化世界及物联网领域发展带来两项前沿科技:全新理念的e-AI技术支持设备端智能化;SOTB超低功耗技术支持万物互联。
瑞萨电子正在开发中的DRP以及SOTB技术将为嵌入式系统领域提供新的附加价值。DRP(动态可配置处理器)技术可灵活地随机重写电路。对于无法随时自由连接到云或对实时性有高要求的嵌入式系统应用,DRP技术能够大显身手。即使不连接云端,DRP也可在独立系统中应用AI。瑞萨电子嵌入式人工智能e-AI,以此大大扩展了终端设备智能化的可能性。
再就是SOTB。正常的低功耗技术,其特点是只能在运行或待机模式中择一保持低功耗。而SOTB的独特性在于其在两种模式下都能保持低功耗。这项功能使得构建不需要电池的系统成为可能,从而可以扩展物联网连接设备及其所在场所的范围。“我们相信,DRP和SOTB这两种技术能为AI和物联网的未来应用提供重要的附加价值。” 真冈表示。
瑞萨电子中国产业解决方案中心OA&ICT部部长陈建名深入浅出地介绍了瑞萨电子的e-AI解决方案,以及核心的技术,包括DRP和SOTB。
首先看e-AI解决方案。他指出,目前在市场上,各种各样的电子产品设备都增加了AI功能,而且绝大部分产品,其AI学习与推理都是在云端进行。特别是在OT中的终端产品或者设备,通过云端做AI的学习与分析,可能会造成时间上的网络延迟、带宽的拥挤以及网络安全性和功耗的问题。考虑到这几点,瑞萨电子推出了e-AI解决方案,可以通过客户端学习的AI模型,把它融合到终端的产品和设备,实现实时、安全和低功耗的终端智能化。
他介绍说,2017年7月,瑞萨电子首次公布e-AI方案,通过瑞萨电子提供的e-AI翻译器,把客户AI模型翻译到C语言,然后在瑞萨电子RX系列MCU里进行AI的终端推理功能。2018年10月,第二代e-AI的方案推出,通过将瑞萨电子独有的DRP技术嵌入到芯片中,实现基于DRP的e-AI解决方案。
DRP即动态可编程处理器。客户可以按照其需要,在不同的时间对DRP的硬件逻辑编程,实现一些并行的数据处理。DRP技术特别适用于图像处理。除了第二代e-AI解决方案,瑞萨电子在今年的第四季度也会推出第三代e-AI解决方案,届时将配置能力更强大的 DRP AI芯片。“这个DRP AI跟第二代DRP有什么区别?主要在于它在器件中额外配置AI MAC(乘加运算),特别适合卷积神经网络。里边的卷积层需要大量的计算,我们AI的MAC硬件可以实现非常快速的重复叠加计算。所以DRP AI第三代产品刚好能满足卷积神经网络应用。”陈建名解释说。
“同时,瑞萨电子第四代产品Class 4 e-AI解决方案DRP AI 2也在规划当中。这个产品目的是实现在终端的增量学习功能。”他补充说。
DRP是瑞萨电子独有的技术,在同等功耗的前提下,比目前市场上的一些MCU、DSP或FPGA的处理能力高十倍或一百倍。反过来说,在相同的处理能力下,其功耗会比目前市场上的这些处理器低很多。
该产品的目标应用场景包括智能工厂、智能家居、智能基础设施。例如,对于工业控制应用,e-AI方案可以通过学习完的数据,利用电机上的加速传感器分析判断从传感器所采集的信息到底是正常还是异常。然后再将其传送到控制中心或控制系统进行通知。这样可以大大改善整个生产的效率,避免停机,同时也可以降低维修的成本。
另外一个应用场景就是生物认证。这在机场或口岸的出入境,以及办公楼进出系统中有广泛应用。
DRP包含多组处理单元、存储器和DMA控制器。DRP可以根据用户需求进行编程,按不同的时间计算不同的算法,同时可以实现不同算法的并行处理,每一个时钟周期都小于1ns,因此,非常适合图像处理这种应用。
AI的神经网络包含几个不同的处理层:卷积层、池化层和全连接层等等。DRP非常适合作为卷积神经网络的AI加速器。第三代DRP配置AI MAC,里面有多组快速处理单元,能实现非常有效的计算。卷积层本身需要处理大量的数据,同时其数据需要不断赋予权重,然后再重复计算,需要快速的处理单元去做乘法或加法。这样,配置了AI MAC的DRP就可以真正满足卷积层这种复杂的计算。
CPU和DRP实测对比。左边是一个500MHz时钟频率的CPU,右边是第二代DRP,同时进行Canny边缘检测算法的运算。500MHz CPU需要140ms,而DRP只有40MHz,处理速度却比500MHz CPU快十倍以上。
接下来看另外一个核心技术,SOTB(薄氧化埋层覆硅)。SOTB是瑞萨电子自己研发的超低功耗工艺技术,它可以实现无掺杂的晶体管。无掺杂结构可以降低晶体管淤积特性变化。对比传统的平面式晶体管的淤积特性变化,这种无掺杂通道和结构可以将特性变化降低2/3。减小晶体管的淤积特性变化,就可以在超低的电压下,比如0.5V左右,进行比较稳定的操作。同时也可以大大降低工作电流和待机电流。
SOTB技术在一些特定条件下,电流消耗只是传统的MCU的1/10。
传统的MCU通过3V的纽扣电池供电,间隔性检测传感器的信号采集,再把信息传到云端。如果其数据周期占1%,一个月后系统就可能没电了。如果换成1‰的数据周期,这个系统也只能运行一年左右。
但是,利用SOTB技术做成的MCU,却可以自己不断地、连续性地进行传感器的信号采集。因为本身需要的电流非常低,3μA就已经足够,同时再配合瑞萨电子的嵌入式AI解决方案,就可以通过学习的数据去分析和判断通过传感器收集回来的信息是属于正常还是异常模式,然后才需要把相关的信息传到云端。
由于整个系统都在终端运行,因此可以实现低时延、安全(因为不需要通过云端,所以不会发生信息在传输过程中被窃取的情况)和低功耗的效果。
SOTB应用方案的路线图可以分成三个阶段。第一阶段,该技术预计在今年的下半年在中国市场正式发布。首要目标应用场景是一些需要经常更换电池或电池维护的应用。第二阶段,在2021年左右,计划会把无线技术(如蓝牙)集成进去,从而扩展应用场景,包括智能家电或智能楼宇,以及个人健康产品。第三阶段是长远目标,不但会集成无线技术,同时也会将嵌入式AI解决方案整合到器件里,做成一个完整的方案,进一步扩展应用的场景,包括农业、智能交通等。
陈建名最后为大家演示了三个demo。第一个demo是3D手势识别,瑞萨电子会通过e-AI解决方案提供手势数据的学习工具、录制工具和AI学习工具。工程师只需要做很小的代码改动,不需要重新再写复杂的算法,就可以达到很高分辨率的3D手势识别和控制。
第二个demo也跟e-AI解决方案相关,是一个电机异常检测的案例。用瑞萨电子32位MCU来实现电机控制,以及e-AI推理功能。通过配置在电机上的加速传感器收集信号,再通过学习数据来判断所收集的信息是属于正常模式还是异常模式。同时将计算出的故障率在电脑上显示出来。
第三个demo是用DRP进行实时图像处理。这个demo板里所用的控制器是RZ/A2M,这个主芯片里配置了动态可编程的处理器。一些图像处理可能会分成很多不同的算法——收集完图像后还需要去分析,做图像的解码等。动态可编程处理器的主芯片真正可以满足这种图像处理复杂的计算要求。它可以并行处理不同的算法,取决于用户怎么对逻辑电路进行编程。
相比528MHz主频的Arm Cortex-A0处理器,RZ/A2M的处理能力快13倍。
DRP另外一个优势是低功耗。“虽然第二代DRP的主频只有66MHz,第三代是250MHz,但是主频低不代表处理能力会相对降低。主频低可以实现低功耗和并行数据处理,所以其处理能力比主频高很多的MCU或者MPU更强大,比A9的处理能力快13倍。这是瑞萨电子DRP真正的优势。”陈建名解释说。