近日,NVIDIA首度公开 NVIDIA A100搭配 Arm架构 CPU的性能表现,称配备有 ARM 和 x86 CPU 的配备 A100 GPU 的服务器具有非常相似的性能(尽管 x86 仍然具有更高的峰值性能)。
值得一提的是,虽然 ARM 在低功耗/高效率场景(智能手机)中击败了 x86,但它无法将功率效率扩展到高频率。这同样也是苹果新款 A15 芯片迄今为止相对令人失望的原因之一。
我们看到基于 ARM 的 A100 服务器实际上在3d-Unet 工作负载中击败了 x86,而更常见的服务器(如 ResNet 50)仍然以 x86 为主。
“Arm 作为 MLCommons 的创始成员,致力于创建标准和基准的过程,以更好地应对加速计算行业的挑战并激发创新,”Arm 的 HPC 和工具高级总监 David Lecomber 说。
“最新的推理结果表明,由基于 Arm 的 CPU 和 NVIDIA GPU 提供支持的基于 Arm 的系统已准备好处理数据中心的各种 AI 工作负载,”他补充道。
此外, NVIDIA 指出 A100 GPU 在 MLPERF 基准测试中比 CPU 快 104 倍。
MLPerf 的基准测试基于当今最流行的 AI 工作负载和场景,涵盖计算机视觉、医学成像、自然语言处理、推荐系统、强化学习等。
从流行的图像分类ResNet-50基准到自然语言处理,所有的一切都经过了测试,A100 GPU在所有方面都独占鳌头。
此次公布 Arm架构测试表现亦对 NVIDIA往后的布局有重大意义,首先 NVIDIA预计在 2022年公布首款基于 Arm指令级的服务器级 CPU产品 Grace, Grace不仅是 NVIDIA首度开发的 Arm架构服务器处理器,更重要的是针对 NVIDIA的 GPU加速特性如NVLink等提供支持,相较 x86架构连接技术受制 Intel与 AMD的情况,并提供 CPU对 CPU、 CPU对 GPU的相互连接与内存共享等特色, Grace有望进一步提高异构运算的核心沟通与内存规模。
Demi Xia编译
责编:Demi
另一方面,虽然目前受到诸多阻挠,不过 NVIDIA仍努力朝向收购 Arm为目标,一但 NVIDIA成功与 Arm合并,也意味着更多 Arm架构服务器制造商与创业公司能够借此跨足混合加速运算的行列,毕竟 NVIDIA不仅只是在硬件架构提供对 Arm的支持,同时亦在软件部分进行深度合作,使所有基于 Arm架构的处理器得以受惠。