端到端AI加速只需单芯片？AMD二代Versal自适应SoC带来边缘新突破-EDN 电子技术设计

 虽然仍然受限于嵌入式系统本身的尺寸、功耗、性能等多方面的限制，但是AI浪潮的席卷为所有的边缘设备带来了新的可能。4月9日，AMD正式发布了其第二代Versal自适应SoC产品，其中包括第二代Versal AI Edge系列，也就是AI驱动型嵌入式系统……

随着以ChatGPT为首的大模型的爆火，AI带来了一场新的革命，医疗、交通、智能零售、智能工厂、智能城市等各个领域，AI所展现出的前所未有的生产力提升，正让其加速融入每一个人的生活。边缘端也是如此，虽然仍然受限于嵌入式系统本身的尺寸、功耗、性能等多方面的限制，但是AI浪潮的席卷为所有的边缘设备带来了新的可能。AMUednc

4月9日，AMD正式发布了其第二代Versal自适应SoC产品，其中包括第二代Versal AI Edge系列，也就是AI驱动型嵌入式系统，以及面向经典嵌入式系统的第二代Versal Prime系列。AMUednc

AMUednc

第二代产品性能提升了什么？

根据官方的数据，第二代Versal自适应SoC在AI引擎、CPU、实时处理、可编程逻辑、安全性和集成化方面相较于第一代产品实现了显著的提升：AMUednc

AI引擎性能提升，第二代产品采用了新一代的AI引擎AIE-ML v2，通过扩展的数据类型支持，相较于第一代能够实现3倍的每瓦TOPS提升。
CPU性能提升，CPU全面升级提供10倍的标量算力，可以实现8倍的Arm Cortex-A78AE核心，每核心最高频率达2.2GHz，并且有高达200.3K的DMIPS算力。
实时处理能力提升，针对控制功能的实时处理单元RPU拥有高达10倍的Arm Cortex-R52核心，每核心最高频率为1.05 GHz，具有28.5K的DMIPS算力。
领先的可编程逻辑，可进行非常灵活的预处理，包括传感器融合和数据调节，并加入了新的硬图像和视频处理。
安全性提升，支持ASIL D和SIL 3安全标准，将通过车规级认证和安全认证。
集成化提升，集成化更高，可以减少外部组件，降低系统功耗、体积和成本。

AMUednc

为了更为直观的展现第二代产品的优势，AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm举出了三个具体的应用案例：AMUednc

在L2+/L3高级自动驾驶辅助系统(ADAS)应用中，由于新加入的硬图像处理的功能，第二代产品具有4倍的图像处理能力，但所消耗的功率却与第一代相近。
对于智慧城市应用，往往会涉及很多的视频处理，新产品能为边缘AI设备缩小30%的占板面积并支持2倍的视频流，也就是每路视频流占板面积缩小65%。
最后是视频流，第二代产品一般用于专业的音视频和广播场景，能够实现非常高精度的流量，每秒约60帧，与Zyng MPSoC的效率相比，能够提供2倍的视频处理能力，每路视频流占板面积缩小35%。

AMUednc

用单芯片加速AI的全部阶段？

AI驱动型嵌入式系统一般包含预处理、AI推理、后处理三个阶段，常规的操作是使用包含可编程逻辑的非自适应SoC进行传感器数据的预处理，在推理过程当中使用矢量处理器，然后在后处理阶段去使用一些高性能的嵌入式CPU。也就是说，工程师需要使用一系列不同的处理器，才能对三个阶段进行优化，并没有一类处理器能够同时优化这三个阶段。AMUednc

AMUednc

而AMD的第二代Versal自适应SoC产品最为独到的优势之一就是可以为嵌入式系统带来单芯片智能性，在单个器件中提供端到端的加速：AMUednc

预处理

该阶段的目标是要降低时延和增加确定性，一般会有有两种处理方式，一是使用非自适应的SoC，虽然有的也有I/O接口或者硬ISP，但是它的数量往往非常有限，缺少灵活性。工程师如果想照顾不同的传感器，以及把更多不同类型的数据载入这个过程，就必须通过外部的内存来做存储和缓存，但由于这些处理器并没有经过优化，所以效率会变低，时延是也会变大。AMUednc

AMUednc

另一种方法也就是第二代Versal自适应SoC所使用的可编程逻辑，这种方法更为灵活，因为有可编程I/O，可编程逻辑，还有硬IST，所以可以进行定制的可编程逻辑以实现差异化，并且由于不需要外部内存，也没有缓存的需求和设置，执行时间会非常短，时延也能够大大降低。AMUednc

AMUednc

AI推理

推理面临的主要挑战包括巨大的吞吐量，以及非常高的精准度要求等。由于新一代产品可以支持更多的数据类型，也就可以支持不同程度的精准度以及吞吐量，对于共享指数数据类型可以在提高吞吐量的同时也不减损精准度。AMUednc

AMUednc

针对于不同的数据类型第二代Versal自适应SoC都可以实现非常高的吞吐量，在Dense TOPS方面，MX6数据类型，最高端为370 TFLOPS；INT8数据类型，最高端为184 TOPS，如果是稀疏度的话，性能还可以翻番。同时，新一代的AIE-ML v2 AI引擎，还支持一些推理以外的附加功能，如数据信号的处理(FIR、FFT等)、视觉以及其他。AMUednc

AMUednc

后处理

对于这一阶段来说，CPU性能的提升是巨大的，10倍的标量算力，8倍的Arm Cortex-A78AE核心，10倍的Arm Cortex-R52核心，更高性能的CPU也就能支撑起更为复杂的运算。此外，第二代Versal自适应SoC还提高了功耗效率，并支持信息安全和功能安全，整个器件都是按照ASIL D、SIL 3级别设计，以更好的应对系统故障。AMUednc

AMUednc

总结

总的来说，与第一代产品相比，第二代Versal自适应SoC可以说是一代产品的补充而非替代，二者的目标应用并不重叠，二代产品所针对的主要是中央计算，而一代产品更多的是边缘传感器或者CPU卸载。而目前，第二代Versal AI Edge系列产品已经有了实际应用案例，斯巴鲁的EyeSight视觉系统就将基于该器件，以支持碰撞前制动、车道偏离预警、自适应巡航控制和车道保持辅助。AMUednc

AMUednc

Manuel表示，现在早期试用计划已经展开，目前正与主要客户进行接洽，包括斯巴鲁，早期的访问文档现在已经发布，可以即刻采用第一代评估板和设计工具开始展开设计。第二代的Versal™ AI Edge系列和第二代的Versal Prime系列产品，样片会于2025年上半年发布，评估套件和系统模块将于2025年年中推出，量产芯片将于2025年末面世。AMUednc

责编：Ricardo

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

谢宇恒

原机加工行业工程师，现Aspencore编辑，专注电子，关注未来。

进入专栏

新品嵌入式系统安全与可靠性接口/总线人机交互操作系统处理器/DSP 知识产权/专利汽车电子智能硬件人工智能消费电子技术实例产业前沿 ED

上一篇： 中移动宣布商用5G-Advanced网络，中国又全球领先了？ 下一篇： 无需芯片和电池，就能实现发光显示、触控的新型智能纤维

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

麻省理工开发可穿戴超声贴纸，可24小时监测肝、肾等内脏超声波贴纸能够对器官僵硬度进行连续监测，为肝脏和肾脏衰竭等疾病的早期检测带来了革命性的变革。
射频模块缩小也能提高热性能，“薄型化已成趋势” 封装创新一直是元件冷却的关键，尤其是对于 MOSFET 和 IGBT 等功率开关器件。尽管射频功率放大器模块的内部工作原理与功率器件的开/关非常不同，但将这些器件做得更小更轻的要求同样适用于射频功率放大器模块。由于大规模多输入多输出5G MIMO系统的多通道要求，这种 "做得更小，但做得更多 "的需求尤其强烈。
将片上网络（NoC）技术扩展到Chiplets上人们普遍认为小芯片将为未来的设计提供动力，但我们所说的 "未来 "指的是什么呢？就在一年前，业内人士还预测未来五到六年才会广泛采用。然而，最近有几家公司推出了芯片组产品，表明采用芯片组技术的时间可能比预期的要早。
摩托罗拉Nexus 6手机拆解：都有哪些蜂窝通信IC？本文探讨了摩托罗拉Nexus 6手机的内部构造，并重点关注了与蜂窝通信相关的元器件，包括RF收发器、蜂窝调制解调器和Wi-Fi/蓝牙IC。还概述了访问手机内部的分步过程。
差点失火！价值百万中央空调面板半夜烧焦，拆解看谁来背锅中央空调的控制面板烧毁，都有哪些原因？虽然底座已烧得模糊不清，但依稀可见电容器爆掉的样子，难道又是电容惹的祸？让我们拆开来一探究竟。
氮化镓半导体：你所不知道的“进化史” 就在几年前，GaN还被认为是一种无用的半导体，这主要是因为GaN是一种非常不完美的晶体。因此，科学家和工程师克服了重重困难，才使GaN可用于各种应用。本文将介绍GaN技术的起源，让我们来先睹为快。
东软睿驰与安霸携手实现乘用车主流车型量产东软睿驰第三代前视智能摄像头X-Cube 3.0采用安霸CV22 AI视觉感知SoC，面向L2+级别的AI感知算法基于安霸CV22平台实现量产落地
老外教你如何DIY无线信号干扰器本文所设计的2.4GHz干扰器虽然简单但有效，这个模块可以屏蔽掉蓝牙和Wi-Fi信号。由于近来半导体供货紧张，我在设计时考虑到了使其实现成本尽可能低。
来自中国的可编程十进制电阻器——有什么用呢？ AspenCore旗下波兰网站elektroda.pl的网友买了个中国产的十进制电阻器（或称为可编程SMD电阻器），用来检查万用表测量结果是否准确。除此之外，它还有什么用呢？
拆解HDD：探究内部机电奇迹我发现硬盘驱动器(HDD)的机电奇迹才是更让人惊艳的技术成就；而这也意味着今天的拆解对象就是HGST Ultrastar 7K3000 3TB硬盘…
儿童电子学（九）：简单的晶体管实验在物理层面，晶体管的内部功能非常复杂，但是在实践中，在一些简单的实验中使用它却非常容易，每个人都可以负担得起。
儿童电子学（七）：电位器在本文中，我们将了解如何使用最重要的可调节电子元件之一——电位器（电位计）——来创建具有可变强度的光。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

端到端AI加速只需单芯片？AMD二代Versal自适应SoC带来边缘新突破

第二代产品性能提升了什么？

用单芯片加速AI的全部阶段？

预处理

AI推理

后处理

总结