AI加速器能促成绿色数据中心吗？-EDN 电子技术设计

 加速器使AI处理受益最大，CPU则继续在超大规模和企业数据中心市场赢得席位，因为CPU应用更加灵活。随着AI应用的不断扩大，以及新的5G应用产生更多的非结构化数据，数据中心的能耗不太可能很快下降。

由于大部分繁重的AI任务都是在云端完成的，因此人们很容易忘记AI需要大量的计算资源及电力。OvKednc

马萨诸塞州大学阿默斯特分校去年的一项研究发现，训练一个大型自然语言处理（BERT）AI模型因消耗电力而产生的二氧化碳（CO2），相当于跨大西洋往返航班对每个乘客所产生的CO2。那只是一个模型，虽然是变换网络，但只需训练一次。开发过程中通常会对模型进行多次调整和反复训练。如果将神经网络结构搜索（一种使用AI来调整模型的AutoML技术）加入一个大小适中的转换器中，其CO2总排放量将猛升到几乎与5辆美国汽车的终身排放量相同。OvKednc

AI加速器有望提高AI处理的计算效率。随着AI处理量的不断增加，数据中心将会采用这些新的专用加速器。OvKednc

但是AI加速器可以节省能源吗？究竟是总的用电量下降了，还是数据中心只不过利用同样的电力实现了更多的计算？OvKednc

AI训练策略

“AI计算使用的能量多少是由几个因素决定的。”IBM Cognitive Systems技术计算副总裁David Turek解释说，“采取什么样的策略来训练模型，会影响所消耗的能量。每瓦特的计算量并不是特别有用的指标，因为有很多种不同的方法可以降低总能耗。”OvKednc

他补充说，整个系统架构和应用环境决定了实际上需要多少能源。“从模型训练到模型部署，计算能力的不同级别直接影响其基础架构，从而直接影响所消耗的能源。”OvKednc

人们通常认为，AI系统中一次只训练一个模型，然后将其部署到其他地方进行推理。但事实并非如此，典型的AI系统会多次训练很多模型，并且可能同时在多个模型上进行推理以获得最佳结果。OvKednc

完成部署后，有时会使用联邦学习（federated learning）之类的技术，在边缘而不是回到数据中心更新增量模型。需要消耗多少能量取决于在边缘进行什么处理。OvKednc

换句话说，训练特定的AI模型所消耗的能量并不是直接就可以确定的。“但数据中心的基础设施是固定的，因此调整工作流程是节省能源的最好方法。”Turek说。OvKednc

可能的方法有：将AI模型与传统的高性能计算融合，以减少所需的总计算量；缩短完成一项工作所花的时间，以减少GPU等高能耗AI加速器硬件的使用；避免在数据中心使用联邦学习之类的技术重复训练。OvKednc

Turek说：“这是从管理的角度来聪明地安排工作流程，利用最佳的方法为现有系统分配可用的能源。通过能源预算和能源消耗，运营商可以在其硬件基础架构上进行调度分配。”OvKednc

在更高的温度下运行

服务器制造商Supermicro去年年底发布的数据中心环境实践年度调查报告显示，能源效率仍然有机会提高。Supermicro营销和网络安全副总裁Michael McNerney认为，这些机会正在流失。OvKednc

McNerney说：“我们认为一些基本的最佳实践可以为客户带来很大价值。其中的一条是，相比传统的数据中心环境，我们今天构建的系统可以在更高的温度下运行，许多长期从事数据中心运营的人却没有意识到这一点。”OvKednc

在目前的设计中，不再需要将设备冷却到23~25°C来确保其性能和可靠性。一些“绿色”数据中心处于极端温度下，即便是很小的变化，例如减少空调的使用，也可以节省能源。OvKednc

OvKednc

图2：现代服务器和基础设施可以在更高的温度下运行，并且切换为多节点系统，从而降低了总能耗。OvKednc

多节点系统是节省能源的另一种方法，其中多台服务器在共享的基础架构上运行。这种配置减少了所需的大型电源和风扇数量。多节点系统具有更高的能源效率，可以在更高的温度下运行，并提供更高的功率密度。OvKednc

Supermicro的调查还发现，目前每个机架的平均功率密度为15kW，服务器进气入口温度为23.5°C，服务器每4.1年更换一次。而在采用高度优化绿色设计的数据中心（占受访者的12％），每个机架的功率密度超过25kW，平均入口温度为26.5°C，服务器每2至3年更换一次。因此，Supermicro得出结论，大多数数据中心仍需继续优化能效。OvKednc

令人惊讶的是，大多数受访者并不认为能耗是成功的关键指标。“我们已经看到，公司的设施预算与硬件及系统的资产购置成本是分开的，它们与人力成本也是分开的。我认为人们很清楚地知道这一点，但是并不会进行综合考虑和优化。”McNerney说。OvKednc

“较大的数据中心更了解总运营成本，但若增加资产购置预算，能源预算就会减少，人们有时很难把这两者关联起来。”OvKednc

McNerneyt认为整个数据中心的功耗并不会很快下降。他说：“长期的发展趋势是，一些在线服务的能耗会随着效率的提升而改善，然而随着5G和AI的逐渐普及，总体功耗仍将继续增加。”OvKednc

电费与能耗

英伟达加速计算产品管理总监Paresh Kharya表示，数据中心运营商希望全面提高能效，因为电费占其运营成本的25％。OvKednc

能源使用效率（PUE）是一项广泛使用的用来衡量能源节约的指标，表示计算所消耗的能源与数据中心基础设施消耗的总能源之比。目标是PUE等级为1。OvKednc

Kharya说：“多年来，超大规模数据中心的PUE接近1或1.1，非常高效。企业数据中心也取得了很大进步，大多数情况下，其PUE等级已经从大于2降到了远远低于2。”OvKednc

超大规模数据中心采用优化的机架和散热设计，可以大规模运行，其优化和使用复杂技术的能力是大多数企业数据中心不具备的。Kharya表示：“许多企业已开始采用这些创新技术，能源效率得到了显著提高。”OvKednc

由于各家公司关注的是电费而不是功耗，所以Kharya认为，执行任务所花费的时间是一个重要因素。“例如，在一台只有CPU的服务器上训练ResNet-50模型的图像识别可能需要长达三周的时间，而配备英伟达V100 GPU的服务器可以在一天之内完成这一任务。”他补充道。OvKednc

“每台配备英伟达GPU的服务器比配备CPU的服务器消耗的能源更多，但它完成任务的时间将大大缩短。因此，如果使用GPU加速器，用于完成AI处理的整体能耗将降低至原来的20到25分之一。”Kharya强调。OvKednc

了解数据中心工作负荷

英特尔数据平台营销总经理Allyson Klein表示，数据中心运营商会尽量确保所有系统高效运行，让昂贵的基础架构提供最大的计算能力。OvKednc

“数据中心运营商的主要目标是使基础架构的性能达到最好。”Klein说，“性能高低取决于系统和机架的级别，同时还需要整个数据中心协同工作，使每瓦性能达到最高。”OvKednc

因此，为了部署合适的基础架构来满足性能和能耗要求，全面了解数据中心的工作负荷非常重要。最理想的结果是计算容量更大，功耗更低，并且不会闲置基础设施而白白消耗电力。OvKednc

究竟是在CPU中集成加速功能还是采用分立的加速器，这通常需要进行权衡。Klein说：“加速器会增加功耗，但如果它一直工作，则整体效率更高。如果加速器完成大量工作，利用率高，在客户愿意投资基础设施的情况下，使用分立的加速器是较好的方法。如果不能一直使用加速器，则采用CPU方法可能是更好的选择，因为加速器经常会空闲，耗电却不执行任何任务。”OvKednc

Klein表示，在大多数部署中，AI只是数十万种不同工作负荷的一种。尽管英特尔提供了CPU和专用AI加速器（通过Habana Labs），但由于工作负荷种类很多，从功耗和投资角度来看，Xeon Scalable（CPU）平台可以说是最高效的产品。OvKednc

Klein说：“英特尔的AI策略建立在Xeon Scalable处理器的基础之上，Xeon Scalable内部做了AI优化，并针对机器学习和深度学习进行了大量软件优化。”OvKednc

提高效率

尽管GPU等AI加速器能耗很大，但进行AI处理时，它们的高计算效率可以降低总能耗。AI处理在数据中心所占比例越来越高，但数据中心日常处理的负荷种类仍然多种多样。OvKednc

加速器使AI处理受益最大，CPU则继续在超大规模和企业数据中心市场赢得席位，因为CPU应用更加灵活。随着AI应用的不断扩大，以及新的5G应用产生更多的非结构化数据，数据中心的能耗不太可能很快下降。OvKednc

（原文刊登于ASPENCORE旗下EEtimes英文网站，参考链接：Can AI Accelerators Green the Data Center?）OvKednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

人工智能数据中心电源管理产业前沿 EDN原创

上一篇： eSIM卡会取代SIM卡吗？ 下一篇： 希望助华为渡难关！华为张霁为何如此自信？（附Top PhD论文）

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞 2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化，集成电路企业如何在新的一年里保持竞争力并实现可持续发展？
Arm 技术预测：2025 年及未来的技术趋势 Arm 对 2025 年及未来的技术发展做出了预测，范围涵盖技术的各个方面，从 AI 的未来发展到芯片设计，再到不同技术市场的主要趋势···
该如何设计PCB以保证恶劣环境下的信号完整性在现代电子设计中，保持PCB信号完整性是一项越来越具有挑战性的任务···
CES 2025：Edge AI硬件加速再掀热潮边缘计算/边缘人工智能(Edge AI)一直是热门话题，在CES 2025也不例外。然而，实现边缘计算/智能的底层硬件是什么？又是如何实现与应用的呢？
英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
全自动手术机器人出现，缝合速度比医生还快30%？美国约翰霍普金斯大学和斯坦福大学的联合团队创造了一项前所未有的突破，他们首次对机器人进行了训练，使其能够像人类医生一样熟练地执行相同的手术程序···
2024是AI MCU元年？ 2024年开启了MCU领域的AI时代，2025年可望见证更多轻量化AI模型在MCU上的进一步突破...
探索工业应用中边缘连接的未来我们的世界正变得更加智能且紧密相连，楼宇和工厂正以前所未有的方式实现自动化。为了确保这些新系统有效运行，可靠的信息通信至关重要···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···
人工智能前沿｜2025 年影响工程的顶级趋势想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证和确认、降阶模型（ROM）和控制系统设计···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

AI加速器能促成绿色数据中心吗？

AI训练策略

在更高的温度下运行

电费与能耗

了解数据中心工作负荷

提高效率