随着人工智能(AI)引领微电子行业的创新浪潮,供电问题成为当前AI发展的重大瓶颈。亚利桑那州立大学助理教授 Mike Ranjram 在一场活动上,向高级封装领域的专业人士分享了他对 AI 生态系统中数据中心供电挑战的见解。他指出,AI日益增长的电力需求正带来巨大压力,不仅阻碍了技术的进一步发展,还可能对电网造成负担。
AI用电需求有多大?
AI 的发展需要海量电力支撑。Ranjram 提到,未来五年内,亚利桑那州的电网峰值负载将增长 40%。目前,仅当地的亚利桑那公共服务公司(APS)就收到了来自数据中心的 10 吉瓦(GW)电力并网申请。10 吉瓦是什么概念?这大约相当于几座大型电厂的总发电能力,足以说明需求之巨大,而且这种增长趋势还在继续。
如何解决AI供电问题?
Ranjram 提出了几个核心技术概念,帮助我们理解应对 AI 用电挑战的关键:
上游转换器(Upstream Converters)
上游转换器是将电力电压提高的装置,用于满足更高电压需求。
电力隔离(Power Isolation)
这是一种保护电子元件免受电击的技术,可提高系统安全性。
功率因数校正(Power Factor Correction)
通过提升电能转化效率,减少电力浪费。
这些技术需要协同运作,一旦其中一个环节出现问题,就会导致整个供电系统的瓶颈。Ranjram 形象地比喻道:“电压提高了,人们觉得问题解决了。但随后电流增加,又会回到同样的困境。”
为了缓解供电压力,目前的解决方案之一是提高上游转换器的功率密度,也就是在相同体积内传输更多电力。例如,从传统的 12V 转换器逐步过渡到 48V 转换器。这种短期方案可以暂时缓解问题,但并非长久之计,因为 AI 的用电需求仍在不断攀升。
点负载转换器(POL)的角色
除了上游转换器,点负载转换器(Point-of-Load Converters,简称 POL)也在供电中扮演重要角色。POL 是一种靠近负载位置的直流-直流转换器,广泛用于高性能半导体供电。Ranjram 提到,当前大多数 POL 采用多相降压转换器技术,这种技术成熟且可靠,但在扩展性能上面临瓶颈。
图:解析人工智能的高能耗要求
即便如此,POL 仍然具有许多优势:
并联化:通过将多个电源相连,均匀分担负载,提升总电流容量。
广泛支持:市场中对这种技术的接受度较高。
适配性强:现有数据中心架构已普遍采用这种方案,无需大幅改造。
实际上,POL 的重要性在当前行业中毋庸置疑。以 NVIDIA 的 H100 GPU 为例,Ranjram 指出,这块顶尖的显卡上大部分面积实际上是分布着 28 个电源转换器,为主芯片提供所需电力。
未来的解决方案:垂直电力传输
Ranjram 提出,垂直电力传输(Vertical Power Delivery, VPD)或许是未来的一种解决路径。与目前的水平电力传输方式不同,VPD 可以显著降低电流传输路径中的阻抗(对电流的抵抗),从而减少电力损耗。此外,VPD 还能降低系统的电阻和电感,进一步提升供电效率。
总结与展望
AI 的电力需求是个复杂的问题,短期内需要通过提高功率密度和技术优化来解决,而长期来看,垂直电力传输等新方案可能会引领未来的发展。尽管挑战重重,但技术的快速进步让我们对未来的解决方案充满期待。
原文链接:https://www.3dincites.com/2024/12/unpacking-ais-power-hungry-demands/