Arm在HotChips会议上发布了由CSS N2领导的计算子系统(CSS)方向,旨在提供预先集成、优化和验证的子系统,以加速基础设施系统制造商的上市时间,有望影响高性能计算服务器、无线基础设施、工业自动化、城市智能化以及企业边缘计算等领域。
Arm为系统开发者提供更多价值,而无需成为一家芯片制造公司,通过提供经过预先设计、优化和验证的子系统,包括核心、一致性互连、中断、内存管理和I/O接口以及SystemReady验证,能够在整个系统开发周期中节省大量时间和资源。
逐步提升基础设施价值链
在自定义芯片设计方面,围绕核心、互连和其他IP的完全自定义设计提供了最大的灵活性和差异化能力。然而,这也伴随着一定的成本,不仅体现在开发方面,还在部署时间方面。在迅速变化的市场环境中,时间因素变得至关重要,尤其是考虑到人工智能等技术在大规模数据中心中的影响。当前的经济不确定性使这些担忧愈发凸显。
在必要的领域进行差异化,而在其他领域进行标准化,特别是当验证过的专业人员能够处理关键的核心组件时。
CSS为多核计算提供了高度标准化但可配置的子系统,包括N2核心(在本例中)、这些核心之间的连贯互联、中断和内存管理、缓存层次结构、通过UCIe或自定义接口的小型芯片支持、DDR5/LPDDR5外部存储器接口、PCIe/CXL Gen5,用于快速IO和/或一致性IO、扩展IO和系统管理。
所有性能、功耗和面积(PPA)指标都针对先进的5nm TSMC工艺和经过验证的SystemReady®以及参考软件堆栈进行了优化。系统开发人员仍然有很大的差异化空间,可以通过添加加速器、专用计算和自定义电源管理等来实现差异化。
Neoverse V2:Arm的下一步
Arm还宣布了Neoverse V系列的下一代产品,这是对V1版本的改进,提高了整数性能并减少了系统级缓存未命中。各种基准测试也取得了进展。Arm在NVIDIA Grace-Hopper组合中的性能表现。NVIDIA分享了与Intel Sapphire Rapids和AMD Genoa相比的真实硬件数据,Grace CPU基本与AMD持平,并且通常比Sapphire Rapids快30-40%。在数据中心功耗限制为5MW的情况下,Grace的性能优于AMD 70%到150%,远远领先于Intel。
总结
Neoverse对Grace-Hopper的贡献是显著的,考虑到人工智能,尤其是大型语言模型,目前在技术领域占据重要地位。大多数工作负载并不需要高端性能,而且人工智能正在逐渐渗透到各个领域。在整体数据中心成本和可持续性方面,在预算有限的情况下,Arm的系统更有发挥的余地。开发CSS N2集成级别预计需要长达80个工程年的努力,现有客户已经确认这一数字的准确性。在工程资源有限的情况下,可以在80个工程年内降低项目成本和进度,不会影响在计算核心周围添加的任何机密差异化。