AI加速器的“选择题”该怎么答？-EDN 电子技术设计

 越来越多的公司开始将机器学习纳入其营运业务中，但随着AI生态系统扩展，他们开始面对如何为其业务决定最适用加速器的「选择题」…

首先，确定您是否真的需要。saxednc

随着越来越多的公司开始采用机器学习作为其正常业务营运的一部份，无论一开始出于何种原因而投资于硬件的公司，如今正因为这一生态系统开始扩展而面对着如何在各种不同加速器之间作抉择的难题。saxednc

在即将上市的各种不同芯片架构之间进行选择时，性能、功耗、灵活度、连接性以及总拥有成本(TCO)当然是判断的标准。除此之外，还有其他值得考虑的因素。saxednc

saxednc

Alexis Crowell (来源：Intel)saxednc

不久前，我有机会针对这个主题采访了英特尔(Intel)人工智能(AI)产品营销资深总监Alexis Crowell。英特尔提供了具有完全不同架构的各种AI加速器产品(包括Movidius、Mobileye、Nervana、Loihi等，但当然不只这些，而且更不用提还CPU产品了)。Crowell很开心地强调，还有一些较不明显的评判标准在选择AI加速器时也应该加以考虑。saxednc

你真的需要AI加速器吗？

事实上，一个最不明显但应该是最直接的问题是：您的应用真的需要最新的AI加速器ASIC吗？saxednc

Crowell说：「这是一个十分普遍的问题，特别是因为AI如此流行。许多公司真的想做AI，但大多数并不是真的了解它的意义，也不知道要从哪里开始。」saxednc

英特尔从指导客户完成整个流程的经验中发现，除了数据中心超大规模业者(hyperscaler)和大型云端服务供货商之外，大部份的客户还没有为AI加速做好准备。大多数的业者都还需要花费大量的时间才能使其数据就绪。saxednc

她说：「如果您只想试着整理资料，那就无需投资于昂贵的加速器硬件，只是为了清理数据。我们与客户的许多对话主要都在于弄清楚他们在这一过程中的位置。」saxednc

Crowell还说，有些数据中心客户可能也有大量可用的备用CPU周期——在此情况下，为什么还要另外花钱呢？saxednc

软件堆叠够成熟吗？

每一种新芯片架构都需要以某种方式进行编程。尽管目前不会有人在缺少相应工具链的情况下发布新芯片，但是这些软件堆叠的成熟度是需要考虑的因素之一。saxednc

Crowell说：「当所有的新创公司一下子涌进这一市场时，真正有趣的是：用于AI的软件堆叠十分困难。英特尔拥有25年编写和软件开发工作经验，目前还有数百人在为所有的产品组合执行软件作业。我认为，将其整合于人们已在使用中的架构、编译程序堆叠或任何看起来类似的东西中，对于在进行硬件决策时的理解非常重要。」saxednc

Intel-Movidius Myriad-X saxednc

英特尔的Movidius Myriad X视觉处理单元(VPU)瞄准了无人机、机器人和智慧相机（来源：Intel）saxednc

是否考虑过安全性？

Crowell说：「当今的安全性(security)比以往任何时候都更重要。」他并强调数据的安全性和业务模式的稳定性也同样重要。saxednc

她说：「数据本身就应该加入更多的安全性，才能确保它确实是您所期待的数据池或真正的数据量。但是在进行训练之前，如何确保数据安全，从而确定您不至于取得错误的输入？[你怎么知道]会不会有人一直在编造数据的子集，导致其开始影响结果？」saxednc

模型的安全性同样重要。一旦在野外(在终端装置中)部署了模型，就需要保护其免于受到攻击者的尝试骇入、更改模型权重以操纵结果，或者即使只是窃取您的IP (也就是您的模型啊！)。saxednc

她说：「我们正为推论建构一款芯片，为其内建了RAS [可靠性、可用性和可维护性]功能，专门用于解决此问题。由于我们将安全性和AI视为重要基础，因此不可能先打造了解决方案，之后再为了增加安全性而加以改造。您必须从一开始就这样做。」saxednc

芯片是否经过基准检验？

适用于AI加速器的基准检验仍处于早期发展阶段。英特尔是向MLPerf以及百度(Baidu) DeepBench提交结果的少数几家公司之一。尽管Crowell强调，英特尔希望客户能够在不同产品之间进行公平的比较，而基准检验正是一个很好的起点，不过她对于当今基准检验经常使用的模型表感到有些失望。saxednc

Intel Nervana Neural Network Processor saxednc

英特尔的Nervana神经网络处理器提供了训练和推论版本（来源：Intel）saxednc

她说：「如今，ResNet和MobileNet是一种入门级的拓扑，无法反映人们在现实世界中实际上如何使用AI。但我认为这是尝试让所有人看法一致的良好基础，因为有了AI就有很多的[变量]¬¬——批次大小、延迟需求、准确性要求等等...您必须从某个地方开始。而从ResNet和MobileNet开始并不表示我们无法成长为更现代、更巨大且更贴近实际情况的模型。」saxednc

Crowell提到的最后一点是，应该将基准视为未来更广泛发展的一部份，并能将在此讨论的所有问题都纳入考虑。saxednc

她说：「我一直提醒客户不要以基准为其整体决策的判断标准。因为还必须考虑到其他的许多因素¬¬——就像生活中发生的所有大小事，这是十分微妙的。」saxednc

(原文发表于ASPENCORE旗下EDN姐妹媒体EETimes，参考链接：How to Choose Between AI Accelerators，编译：Susan Hong)saxednc

saxednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

人工智能 EDA/IP/IC设计处理器/DSP 产业前沿

上一篇： 实测：5G网络能否替代有线宽带？ 下一篇： 有线充电与无线充电能否同时使用？同时使用会怎么样？

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
Arm 技术预测：2025 年及未来的技术趋势 Arm 对 2025 年及未来的技术发展做出了预测，范围涵盖技术的各个方面，从 AI 的未来发展到芯片设计，再到不同技术市场的主要趋势···
该如何设计PCB以保证恶劣环境下的信号完整性在现代电子设计中，保持PCB信号完整性是一项越来越具有挑战性的任务···
CES 2025：洞察汽车创新未来从CES 2025的汽车方案展示可以看到，汽车OEM正从黑盒解决方案转变为区域架构为主的处理主干，传感器功能也逐渐优化，结合多模态输入数据与情境感知的 ML...
CES 2025：Edge AI硬件加速再掀热潮边缘计算/边缘人工智能(Edge AI)一直是热门话题，在CES 2025也不例外。然而，实现边缘计算/智能的底层硬件是什么？又是如何实现与应用的呢？
英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
全自动手术机器人出现，缝合速度比医生还快30%？美国约翰霍普金斯大学和斯坦福大学的联合团队创造了一项前所未有的突破，他们首次对机器人进行了训练，使其能够像人类医生一样熟练地执行相同的手术程序···
2024是AI MCU元年？ 2024年开启了MCU领域的AI时代，2025年可望见证更多轻量化AI模型在MCU上的进一步突破...
探索工业应用中边缘连接的未来我们的世界正变得更加智能且紧密相连，楼宇和工厂正以前所未有的方式实现自动化。为了确保这些新系统有效运行，可靠的信息通信至关重要···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···
人工智能前沿｜2025 年影响工程的顶级趋势想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证和确认、降阶模型（ROM）和控制系统设计···
人工智能对数据中心基础设施带来了哪些挑战在加密货币和人工智能/机器学习（AI/ML）等新兴应用的驱动下，数据中心的能耗巨大，并将快速增长以满足用户需求···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

AI加速器的“选择题”该怎么答？

你真的需要AI加速器吗？

软件堆叠够成熟吗？

是否考虑过安全性？

芯片是否经过基准检验？