Arm Neoverse CSS新品解析，Arm全面设计助力AI时代的高效实现-EDN 电子技术设计

 在2月22日Arm举办的技术媒体沟通会上，Arm推出了两款基于全新第三代Neoverse IP构建的新的Neoverse CSS产品——Neoverse CSS N3和Neoverse CSS V3···

计算正越来越专用化，通用CPU已不再能满足需求。在过去，软件和硬件分别由不同的公司负责开发，而这样老旧的模式已经无法满足现在对性能的需求，也无法适配软件或硬件的复杂性。企业希望其部署的硬件，甚至在微架构层面，都能被优化，以便顺利运行其软件工作负载。但是此类联合优化很难实现，需要软硬件双方做出巨大的投入才能够完成。t0Kednc

而头部云计算和网络企业对其数据中心、计算设备及运行其中的工作负载非常熟悉，他们高度专注于优化其基础设施的每一层，目的是让这些多样化的工作负载获得最佳性能，更重要的是获得最佳的每瓦性能。但是没有一个基准测试能展现所有工作负载的性能表现，这带来了深入了解每个用例的必要性，并需要有针对性地对其进行调优。t0Kednc

Arm架构作为全球应用最为普及的CPU架构，在多个领域的技术革新中发挥着主导作用，众多国际知名的大型科技企业正基于Arm平台构建新一代系统和基础设施，Arm全面设计(Arm Total Design)生态项目也为此提供助力，它提供了一个生态系统，让参与其中的企业能无缝交付基于Arm Neoverse计算子系统 (CSS)的定制芯片。t0Kednc

t0Kednc

人工智能时代的创新t0Kednc

Arm高级副总裁兼基础设施事业部总经理Mohamed Awad表示：“科技企业选择Arm的原因很简单，因为我们独特的定位能赋予合作伙伴快速创建定制解决方案的能力，并充分利用到强大的生态系统，正是这些特性使Arm Neoverse夯实了全球AI愿景的根基。AI的适用范围不仅是应用服务器和数据中心。AI正成为包括网络、安全和存储等诸多领域不可或缺的一部分，它可应用到包括小型终端到交换机、路由器和基站等各种设备在内的整个基础设施中。我们很荣幸能在其中发挥关键作用，协助科技先行者解决由AI转型带来的不断增长的数据和计算需求。”t0Kednc

赋能全面设计时代

Neoverse CSS是Arm在2023年推出的，它可以让定制芯片变得更迅速，且更易实现。在Neoverse CSS中，Arm负责配置、优化和验证一套完整的计算子系统，并针对基础设施市场的各种关键用例进行配置，从而让其合作伙伴能够专注于，针对特定系统级工作负载塑造差异化竞争优势，比如软件调优、定制加速等。而就在2月22日Arm举办的技术媒体沟通会上，Arm推出了两款基于全新第三代Neoverse IP构建的新的Neoverse CSS产品——Neoverse CSS N3和Neoverse CSS V3。t0Kednc

t0Kednc

Neoverse CSS N3聚焦能效，与CSS N2相比，其每核心的每瓦性能提升20%，可满足基础设施性能要求的高效计算。CSS N3的首个实例可提供32 核，热设计功耗(TDP)低至40W。其可扩展性非常强，可覆盖电信、网络和 DPU 等一系列应用，Arm也同时在考虑横向扩展云配置。CSS N3基于新的Neoverse N3 IP平台打造，为新的N系列引入了Armv9.2功能，能为每个核心提供2MB的专用L2缓存，并支持最新的PCIe和CXL I/O标准以及UCIe芯粒标准。t0Kednc

而对于用户更高性能的需求，Arm推出了Neoverse CSS V3，与CSS N2产品相比，其单芯片性能提高了50%，在单芯片上最多可扩展至128核，并支持最新的高速内存和I/O标准。CSS V3基于Arm新的Neoverse V3核心打造，这是Arm目前单线程性能最高的Neoverse核心。V3还为Arm机密计算架构(CCA)提供硬件支持，同时V3和N3核心均可提供业界领先的专用L2缓存大小，显著改善性能表现。t0Kednc

t0Kednc

代际性能提升t0Kednc

对于这两款新产品，Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll表示：“新产品全方位地实现了非常良好的提升，从视频处理到SQL数据库的性能均有所跃进。如今，人们常常忽视的一点是，有多少计算周期最终被用于压缩和协议转换等后台任务。N系列在压缩方面取得了性能优势，可降低云服务运营商的成本，并最终降低云服务客户的成本。同样地，V系列显著提高了协议缓冲区的性能，这是在数据中心内传输数据的一项关键功能。”t0Kednc

t0Kednc

新系列产品工作负载性能较前一代产品大幅提升t0Kednc

助力AI的高效实现

这两款新产品在AI数据分析工作负载方面的优势更为引人注目。以XGBoost为例，这是一种强大的机器学习(ML)算法，可以帮助人们理解数据并做出更明智的决策，支持Java、C++、Python、R等多种语言。作为一个被广泛使用的经典ML应用，无论是为人们推荐下一个媒体内容，预测高峰时段的打车费用，还是提供相关的机票优惠，我们日常生活中大量使用的各种预测性和定制化在线服务均使用XGBoost作为主要数据库来驱动相关核心算法。t0Kednc

而通过分析应用的关键工作负载核心的特定关键任务算法，Arm能够明确并实施，对提升性能最有效的微架构调整方法。在XGBoost用例中，包括改进分支预测，更好地管理最后一级缓存和相关内存带宽，以及大幅增加 L2 缓存。其结果是，N3的性能提升高达196%，并且这是基于已经超越其他同类厂商的工作负载进行的。t0Kednc

对于2023年爆火的生成式AI和大语言模型(LLM)，Arm当然也十分的关注。Arm认为，目前行业重点更多放在训练LLM 上，但随着生成式AI广泛应用于实际业务场景，其工作重点将转向推理。有分析师估计，已部署的AI服务器中有高达80%专用于推理，且这一数字还将持续攀升。这一转变意味着要找到合适的模型和模型配置，并加以训练，然后将其部署到更具成本效益的计算基础设施上。t0Kednc

对此，Dermot O’Driscoll表示：“吞吐量是其中一部分考虑因素，而在当今广泛部署的基于Arm架构的芯片上，Token生成吞吐量表现相当优异。但还有许多其他因素需要纳入考量。CPU广泛可用，并可灵活用于ML或其他工作负载，此外，CPU还易于部署，并可支持各种软件框架，具备低成本和高能效等优势。因此，CPU推理将是生成式AI计算应用的关键组成。我们可以看到，诸多工作负载已从ML专用的Neoverse功能（如Bfloat16、MatMul、SVE和SVE2），以及我们的微架构优化中受益，而且这一趋势还将继续。”t0Kednc

t0Kednc

Neoverse系列产品生成式AI表现t0Kednc

当前AI计算领域火热，面对不断变化的芯片技术要求，Arm在基础设施领域的前进脚步未曾停歇，始终紧跟市场发展节奏。聚焦Arm Neoverse平台来看，其着手的方向主要包括以下几点：t0Kednc

通过诸如Bfloat16、MatMul、SVE 和SVE2等架构功能，以及微架构的优化，持续提升运行在CPU上的机器学习(ML)计算的表现。
通过支持最新的行业标准接口，以及提供用于一致性高带宽连接的CHI协议，为定制AI加速器与Arm Neoverse平台和Arm Neoverse CSS的紧耦合提供更强的灵活性。
为自研定制AI加速器的合作伙伴提供行业领先的系统互连技术，以实现与主机计算的紧密耦合链接，并提供CPU来处理AI工作的编排，同时支持利用Arm基础设施软件生态系统的云原生软件。

Arm生态系统蓬勃发展

从AI到5G，从云数据中心到边缘计算，全球各地打造新一代计算基础设施的技术先行者，越来越多的开始转向Arm Neoverse平台。据了解，Arm全面设计生态项目于2023年10月正式推出，仅仅经过四个多月的发展，Arm全面设计已经有20多家成员加入，其中包括新的EDA和配套IP提供商，以及来自包括韩国、中国大陆及台湾地区和印度等战略市场的知名芯片设计企业。t0Kednc

t0Kednc

同时，Arm一直在与合作伙伴一起构建和优化云原生软件，以便让其最佳地运行在Arm平台上，Arm基础设施事业部营销副总裁Eddie Ramirez介绍到：“Arm全面设计的合作伙伴正在努力将基于Neoverse CSS的设计推向市场。去年十月，Socionext成为首家宣布计划在台积公司领先的2纳米工艺上开发基于CSS芯粒的合作伙伴。这款配置32核的芯粒可与其他芯粒结合使用，提供可扩展且经济高效的计算解决方案。该设计将基于新推出的Neoverse CSS V3来打造。智原科技也在构建基于芯粒的服务器芯片，该芯片将搭载64颗N系列核心，并基于英特尔代工服务的18A工艺节点进行生产制造。此外，ADTechnology 将提供高性价比的16核CSS N系列边缘服务器平台，他们将与三星代工厂合作，为边缘计算释放更强大的算力。”t0Kednc

t0Kednc

据悉，Arm Neoverse软件生态系统正在不断扩展，以满足所有开发者的需求。从主流编程语言、软件工具、所有主要Linux发行版，到支持网络、存储和大数据以及AI应用的项目，包括软件栈各个级别的知名开源企业，此外还包括大量独立软件供应商(ISV)，这一生态系统正成为云服务提供商部署其云服务的上佳之选。t0Kednc

责编：Ricardo

阅读全文，请先

谢宇恒

原机加工行业工程师，现Aspencore编辑，专注电子，关注未来。

进入专栏

新品 EDA/IP/IC设计人机交互操作系统物联网知识产权/专利工业电子汽车电子智能硬件医疗电子消费电子处理器/DSP 人工智能精英访谈技术实例创新/创客/DIY 产业前沿工程师职业发展

上一篇： 打飞的成为现实，eVTOL是飞行汽车还是“大号无人机”？ 下一篇： 科学家开发出充电更快、寿命更长的电池

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完美升级与补充···
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、高性能要求···
Melexis推出性能先进的温度传感器，以红外技术创新实现全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏感单元与ASIC技术，能够精准监测车轮转速，为防抱死制动系统（ABS）、车身电子稳定系统（ESP）以及电动转向助力系统（EPS）等控制系统提供了有力支持···
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、优化处理能力，以及实现先进的成像雷达功能···
突破传统局限，泰克助力芯朋微理想二极管更安全、更高效在全球能源结构转型和可持续发展的大背景下，光伏产业作为可再生能源的主力军，正迎来前所未有的发展机遇···
Qorvo® 推出车规级 UWB SoC 芯片 QPF5100Q，凭借 Qorvo 全新的 UWB SoC 提供先进的 UWB 功能和可配置软件，使汽车设计师能够定制独特的功能，从而提升产品性能并为最终用户的应用带来差异化优势···
Ceva 推出具有下一代蓝牙高数据吞吐量和 IEEE 802. 交钥匙集成式硬件和软件平台 IP 结合了功能齐全的蓝牙双模和下一代高数据吞吐量，以及适用于 Thread/Zigbee/Matter 的 IEEE 802.15.4标准，并包含了Ceva采用台积电 12nm 技术实现的最先进无线电···
摩尔斯微电子推出MM8108：全球体积最小、速度最快、功耗最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准，配套USB网关，轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

Arm Neoverse CSS新品解析，Arm全面设计助力AI时代的高效实现

赋能全面设计时代

助力AI的高效实现

Arm生态系统蓬勃发展