人工智能(AI)技术已渗透到从消费电子到工业控制的各个领域,其在功能安全中的应用日益受到关注。功能安全是指系统在异常情况下维持安全运行的能力,对于芯片设计、自动驾驶和关键基础设施等领域尤为重要。
本文通过解析工业安全仪表系统(SIS)与自动驾驶两大典型场景,揭示AI在提升系统自主决策能力的同时,引发的模型过度自信、数据漂移、标准适配性不足等核心矛盾。
● AI为功能安全带来了创新解决方案,本文将分为两部分深入探讨:
◎ 首先分析AI在功能安全中的应用及其对芯片设计的意义;
◎ 其次聚焦AI面临的挑战及其应对策略;
◎ 最后展望未来发展趋势。
AI与功能安全的融合既是机遇也是挑战,如何优化AI系统以确保安全性和可靠性,是当前亟需解决的关键问题。
AI 在功能安全中的应用
与芯片设计的意义
AI 技术在功能安全领域,特别是安全仪表系统(SIS)和自动驾驶等安全关键场景中,为芯片设计带来了新机遇。
SIS 作为过程工业保障安全的核心系统,由传感器、控制器和执行器构成,执行安全仪表功能(SIF)并需满足特定安全完整性等级(SIL)要求。
● AI 的引入提升了系统智能化水平,芯片作为 AI 计算核心载体至关重要。
◎ AI 可应用于 SIS 多个环节优化功能安全管理(FSM)和验证与确认(V&V)流程,如数据处理与分析,基于历史数据生成一致性分析结果并自动提取机器可读数据格式,这要求芯片具备高效计算与存储性能以支持实时数据处理;
◎ 故障诊断与预测方面,协助故障分类和根本原因分析,芯片需集成高性能神经网络加速器(如 NPU)支持复杂推理任务;
◎ 甚至在某些场景中 AI 可直接参与安全决策,像自动驾驶中 AI 模型分析传感器数据判断车辆状态并采取控制措施,这对芯片实时性和可靠性提出更高要求。
以自动驾驶为例,AI 芯片需处理大量传感器数据并实现毫秒级响应,不仅要有强大并行计算能力,还需确保极端条件下的稳定性,所以芯片设计采用高性能架构(如多核 CPU+GPU+NPU 组合)并集成冗余机制提升容错能力。
● AI 在功能安全中的应用对芯片设计提出新需求,推动技术进步。
◎ 高算力需求方面,AI 模型训练和推理需要强大计算能力,如自动驾驶芯片集成数十亿晶体管支持每秒数万亿次运算,促使芯片厂商采用先进制程技术(如 5nm、3nm)提升性能;
◎ 低功耗设计上,在工业和汽车应用中,功耗是关键约束,芯片设计需在高性能与低功耗间平衡,通过动态电压频率调整(DVFS)或专用 AI 加速器降低能耗;
◎ 安全与可靠性层面,功能安全要求芯片在硬件层面具备故障检测和自我修复能力,如采用错误纠正码(ECC)内存和双核锁步(Dual-Core Lockstep)技术确保计算结果正确。
◎ 同时,AI 在 SIS 中的应用对功能安全标准提出挑战,现行标准(如 IEC 61508)主要针对传统硬件和软件系统,对 AI 动态性和不确定性缺乏充分覆盖,如 AI 模型训练过程难以通过传统验证方法评估安全性,这要求芯片设计不仅关注硬件可靠性,还需为 AI 算法提供支持,如集成硬件级分布外检测模块识别模型预测异常情况。
行业正在制定新的标准,如 ISO/IEC TS 22440 和 ISO/IEC TR 5469,芯片设计需与这些标准对接,在硬件层实现可追溯性和可验证性以满足合规性要求。
● AI 在功能安全中也面临严峻挑战。
AI 模型存在过度自信问题,即在面对未知或不确定输入时给出高置信度错误预测,在安全关键领域可能导致灾难性后果,如亚利桑那州和佛罗里达州的自动驾驶事故中,AI 系统因未能正确识别复杂场景导致车辆未能及时刹车。
其原因包括
◎ 训练数据偏差,未覆盖所有场景使模型在边缘情况失效;
◎ 模型架构缺陷,深度神经网络易过拟合导致泛化能力不足;
◎ 不确定性量化不足,传统模型仅输出预测结果未提供置信度评估。
为解决该问题,
◎ 芯片设计需集成分布外检测硬件支持,如支持隔离森林或局部异常因子算法的专用模块,通过构建决策树快速隔离异常数据,芯片集成硬件加速器提升检测速度;
◎ 不确定性估计模块,实现蒙特卡罗随机失活或贝叶斯神经网络的硬件支持,如特斯拉 FSD 芯片通过多核架构支持多次前向传播评估预测不确定性;
◎ 实时监控,芯片内置监控单元实时检测模型输出是否超出安全范围,发现异常触发备用机制。
AI 在功能安全中
的数据相关问题
及芯片层面的应对策略
● AI 系统运行时还面临数据漂移、概念漂移和数据缺失等数据相关问题,会降低模型性能威胁功能安全。
◎ 数据漂移指传感器数据分布因环境变化偏离训练时状态,如自动驾驶车辆从晴天行驶到雨天图像数据分布变化;
◎ 概念漂移是硬件升级导致数据语义改变;
◎ 数据缺失则是传感器故障或传输中断导致输入不完整。
● 芯片设计需从硬件层提供支持,
◎ 如持续学习支持,集成在线学习模块使模型在运行时适应新数据,采用片上存储器缓存最新数据供模型更新使用;
◎ 数据增强硬件,通过预处理单元(如图像处理 DSP)增强数据多样性提升模型鲁棒性;
◎ 冗余机制,采用多通道设计,当某一传感器数据缺失时芯片可切换至备用输入。
为提升 AI 系统安全性,行业提出多样化冗余机制,通过多种错误检测方法协同工作,如在自动驾驶中结合拒绝类、隔离森林和不确定性估计,通过多数投票系统判断输入数据可靠性,有 1oo3 机制(只要一个探测器报告异常即判定系统有问题,适用于漏报后果严重场景)和 2oo3 机制(需两个以上探测器报告异常才确认问题,适用于误报影响较大场景)。
芯片需集成投票逻辑单元,支持多种检测方法并行运行,如 NVIDIA 的 Drive AGX 平台通过多核架构实现冗余计算并采用硬件投票机制确保决策一致性,且 AI 算法可动态选择投票策略,芯片需提供灵活可编程接口。
AI 与功能安全的融合为芯片设计带来机遇与挑战。AI 提升功能安全系统智能化水平,推动芯片向高算力、低功耗和高可靠性方向发展,但模型过度自信和数据相关问题亟待解决,芯片设计需通过硬件加速、冗余机制和标准对接加以应对。
未来,随着技术研究深入和标准完善,AI 将在功能安全领域发挥更大作用,芯片厂商需加强跨学科合作,与 AI 专家、安全工程师共同探索创新解决方案,芯片作为功能安全核心保障,重要性将日益凸显。