得益于科技巨头 AMD、英特尔和英伟达竞争的推动,人工智能和数据中心技术在去年进步飞速。
去年,AMD 设计了一项业务战略,以增加对这项技术以及高性能计算或 HPC 工作负载的研发。与2020年的重点相比,该公司计划在未来五年内将某些领域扩大 30 倍。AMD 现在正在为未来做准备,并认识到下一代数据中心在未来几年内随着行业的发展而发展的新需求。
AMD本周凭借其不同的技术进步披露了有关其当前状态的信息。他们的 AI 和 HPC 部分的加速平台的能效比几年前提高了近七倍。这方面的技术包括 AMD EPYC 系列处理器和该公司的 Instinct 计算显卡。
在过去的两年里,该公司推出了一个下一代处理器系列,第三代 EPYC 系列,以及基于 AMD 的 CDNA 技术结构的两种不同的显卡。AMD 创造了最后两款显卡,完全专注于 AI 和 HPC 技术。目前,当前机器使用基于 64-c EPYC 7003 的 CPU 和四个 AMD Instinct MI250 计算加速器,传输的 FP16 TFLOPS 几乎是四个 MI50 Instinct 加速器总和的 14 倍。这批 AMD Instinct MI250 加速器由一个 CDNA 2.0、13312 个 SP 组成,处理频率为 1.0 至 1.7 GHz,功耗为 500W。而这一切都符合公司在 2020 年设定的 30x25 目标。
AMD 的 30x25 概念是一个多路径指南,其中包括扩展 AMD 数据中心设备最基本的性能。这一概念使公司能够进一步发展其每瓦性能效率,进行应用优化,并将精力集中在产品堆栈上,以提高执行力并降低功耗。与 2020 年硬件基线相比,任何进展都将使 AMD 更接近其目标。
公司首席技术官 Mark Papermaster 表示:尽管距离实现 30x25 愿景还有很多工作要做,但工程师们对其工作进展感到十分开心、并对迄今所有结果感到鼓舞。我在此诚邀大家积极与 AMD 取得联络,以获取持续数年的进展报告。
AMD 用 EPYC 7742 服务器平台作为 30x25 的基准比较对象。该 CPU 拥有 64C / 128T,频率在 2.25~3.40 GHz 之间,辅以 256MB 缓存容量,TDP 功耗 225W 。
此外四路 Instinct MI50 计算卡采用了第五代 GCN 架构,拥有 3840 个流处理,GPU 频率在 1450~1725 MHz,功耗为 300W 。
以三角数据初始化(4K 矩阵 DGEMM)应用为例,该超算平台上的每块 MI50 加速卡算力在 5.26 TFLOPs,FP16 性能为 21.6 TFLOPs、功率消耗为 1582W 。
WCCFTech 指出,有了这种工艺技术,AMD 有望将 HPC 平台升级到支持 DDR5 内存(功耗水平较 DDR4 更低)和 PCIe 5.0 的 96C / 192T 霄龙处理器。最后结合多方面的优化,AI 与 HPC 应用程序的 CDNA 软硬件性能也将迎来持续的改进。