点击上方蓝字“MPS芯源系统”,关注我们,了解更多。
如果将思绪拉回到这个夏季最火热的霸屏现场 — 东京奥运会,当你闭上双眼,浮现在脑海来的会是什么?
是苏神那不可思议的起跑瞬间?
还是全妹妹那入水几乎零水花的一幕?
我脑海中浮现的是 AI 高清摄像头拍下的一幕幕精准慢回放,还有科技感满满的 3D 运动员跟踪技术成像。这届奥运会上的黑科技着实让我惊艳了一把又一把,比如“AI裁判员”、“AI教练”等,让屏幕前的观众感受到了前所未有的酣畅观看体验。让人不禁感叹,如此尖端的 AI 技术是如何实现的?
其实想要实现 AI 技术的应用,"神经网络"(neural network)必不可少,人工智能的底层模型就是神经网络,而 AI 系统便是通过基于计算机的“神经”网络来模仿人脑学习并解决问题。
过去几年,尤其是2015年以来,图形处理单元(GPU)和张量处理单元(TPU)成为加速神经网络训练的常见加速器。GPU 得到广泛应用,使得并行计算变得更快、更便宜、更有效,人工智能开始大爆发。
那么问题来了,虽然 GPU 和 TPU 可以处理重复性和密集型的计算,但是却异常耗电。例如,某款最新一代的超级计算机则内置了16个 GPU,每个 GPU 算力达2 petaFLOP,所需系统总功率达到10kW。对于AI 电源系统设计人员来说,提供千瓦功率只是他们的第一个挑战,与此同时,保证效率绝对同样至关重要。其次,空间成本也在不断上升。现代数据中心都包含成百上千个处理单元,因此设备大小非常重要。减小单个单元的尺寸,就可以在大型解决方案相同的空间中应用更多设备,从而实现更高的处理能力密度。
然而,越小的尺寸越需要极大提高功率密度,减小散热面积。这样,散热管理也成为下一代尖端 CPU、GPU 和 TPU 电源设计面临的重大挑战之一。
另外,系统复杂性的增加和设计周期的压缩使设计资源更加紧张,这意味着电源方案相关的电路常常被忽略,直到开发周期的后期才被注意到。实际上,采用MPS 公司的电源解决方案,我们只需很少的时间,并且可能只需很少的电源设计资源就可以解决上述的挑战。
理想的控制解决方案应当兼容多种产品、可扩展、配置灵活且易于使用。
MPS 公司提供了这类理想的高级控制器(参见表1),它们提供了准确的系统控制和精确的监测,电压、电流、频率和故障监测均可在宽范围内进行配置。通过和市面上传统的解决方案的对比,我们可以充分的感受 MPS 方案的先进性。
表1:高级控制器 vs. 模拟和数字控制解决方案
大家都知道AI电源解决方案没有功率级就无法工作,而功率级通常会采用分立式解决方案。 分立式解决方案由驱动器 IC 和一对外部 MOSFET 组成,为三芯片解决方案。还有一种方法是将多芯片驱动器— MOSFET(DrMOS)共同封装到一个 IC 解决方案中。
图1:功率级的常用实现方法
与传统的分立式多芯片解决方案不同,MPS 公司提供了一种单片功率级解决方案,在单个芯片上集成了具有低静态电流的同步降压栅极驱动器、以及一对上管和下管 MOSFET。通过将所有关键元件集成在一个封装中,可以轻松控制驱动器/MOSFET,并最大程度地减少开关节点处的振铃。另外,封装和板级之间的寄生电感也可以大大减少。这种设计可以实现时下最先进的 CPU/GPU/TPU 设计所需的低输出电压和高效率。
单片功率级只需最少数量的外部组件,因此简化了原理图以及 PCB 布局。
图2:传统解决方案与高级解决方案的比较
这种器件的典型功率级可在各种温度下的全负载范围内实现出色的电流检测精度(±2%) ,并以高达3MHz的开关频率工作(见图2)。在紧凑的空间内还可以同时提供各种可配置的故障保护功能,如过流保护(OCP)、相位故障检测和IC温度报告,为设计人员提供了一种小而强大的解决方案,还不会影响效率或瞬态响应。
当今的 AI 系统都是通过多个高性能计算机系统来实现的,它在很多方面都对电源设计人员提出了挑战。传统的数据中心设计正迅速从通用的仅 CPU 解决方案演化为 CPU、GPU 和 TPU 的组合方案,这对电源设计解决方案提出了新的、更严格的要求。数字控制器及其功率级解决方案带来了灵活性和适应性,以及精确的控制、监控和保护功能。它使电源设计人员能够创建具有高效率和高功率密度的最新电源解决方案,可以满足快速增长的 AI 市场当前与未来的高功率需求。