人工智能(AI)和机器学习(ML)技术曾经是大型数据中心和强大GPU的代名词,而今正稳步朝向网络边缘推进,并融入于微控制器(MCU)等资源受限的组件中。在2024年,有越来越多高能效的MCU工作负载与AI功能相结合,在嵌入式系统中实现音频处理、计算机视觉、声音分析和其他算法等各种智能化应用。
以ST(意法半导体)及其STM32N6 MCU为例,它配备了专用于嵌入式推理的神经处理单元(NPU),可以说是ST功能最强大的MCU。此外,它还能执行分割、分类和识别等任务。除了这款MCU之外,ST还提供了软件和工具,协助开发人员降低入门门槛,让他们能在实时操作系统(RTOS)中充分利用AI加速性能。
图1:STM32N6的Neural-ART加速器据称可提供比现今高端STM32 MCU高600倍的ML性能。(来源:意法半导体)
另一家领先的MCU供应商英飞凌也在其PSOC MCU系列中集成了硬件加速器。其NNlite神经网络加速器的目标在于推动以ML为基础的新型应用,例如唤醒、基于视觉的位置检测,以及脸部/对象识别等,涵盖消费、工业以及物联网(IoT)等应用领域。
图2:PSoC Edge系列MCU集成NNlite神经网络加速器,实现以ML为基础的新一代应用。(来源:英飞凌)
TI (德州仪器)则将其支持AI的MCU称为实时微控制器,并在其C2000设备内集成了一个NPU,以实现高准度、低延迟的故障检测。这可让嵌入式应用实时做出精确的智能决策,以执行太阳能和储能系统中的电弧故障检测,以及用于预测性维护的电机轴承故障检测等功能。
图3:C2000 MCU集成了Edge AI硬件加速器,实现更智能的实时控制。(来源:TI)
事实上,ADI更早之前即在其硬件与平台堆栈的基础上集成具有智能、安全与超低功耗(ULP)优势的Maxim MCU,推出了新一代AI MCU MAX78000,基于硬件的卷积神经网络(CNN)加速器,只需消耗微焦耳的能量即可执行AI推理,更高性能的Edge AI MCU系列还可支持复杂的降噪、脸部识别、指纹分析和对象检测等视觉和成像应用。
图4:相较于其他解决方案,AI MCU执行一项AI推理的速度更快、功耗更低。(来源:ADI)
在这些AI MCU上执行的模型,可通过训练来学习和适应不同的环境,这反过来又有助于系统实现超过99%的故障检测准确率,在从而实现更明智的边缘决策。此外,预先训练的模型的可用性进一步降低了在低成本MCU上执行AI应用的门槛。
更重要的是,在MCU内部加入硬件加速器,可减轻主处理器的推理工作负载,释放更多时钟周期用于嵌入式应用。这标志着AI硬件加速MCU漫长旅程的开始。在这一旅程的起点,它将把MCU推向以往需要MPU的应用领域。在嵌入式设计领域,MPU也并未完全具备实时控制设计任务的能力。
随着MCU的性能持续发展,MCU和MPU之间的界限将变得模糊,越来越多适合资源受限的神经网络模型将出现在MCU+AI的应用上,这不仅能让MCU成为更具竞争力的解决方案,也有助于MCU行业迎接新的应用和商机。
图5:支持 AI 的 MCU 将在多种嵌入式系统设计中取代 MPU,并将对于半导体产业带来重大的变革与冲击。 (来源:意法半导体)
无疑地,AI是MCU演进的下一个重大方向,但针对AI优化的MCU还有很长的路要走。例如,软件工具及其易用性将必须与这些AI MCU齐头并进,才能协助开发人员评估AI模型在MCU上的可嵌入性。此外,开发人员也应该能够只需简单点击几下,就能快速测试在MCU上执行的AI模型。
2024年开启了MCU领域的AI时代,到了2025年,我们很可能见证到更多轻量化AI模型在MCU上的进一步突破。
(原文刊登于EDN美国版,参考链接:2024: The year when MCUs became AI-enabled,由Susan Hong编译)