一项由加州大学河滨分校(UC Riverside)工程师团队撰写、发表在《Device》期刊上的技术综述论文,探讨了一种有望革新人工智能未来、并具备更高环境友好性的全新计算芯片形式——晶圆级加速器(wafer-scale accelerators)。
与传统图形处理器(GPU)仅有邮票大小不同,晶圆级加速器是直接以整块硅晶圆为基础制造而成,尺寸如同餐盘般庞大。由Cerebras公司打造的这些芯片,正引领计算架构的一次飞跃式变革。
这篇由UC Riverside多学科研究团队共同完成的同行评审论文指出,晶圆级处理器不仅在计算性能上实现突破,还具备显著的能效优势——这正是面对日益庞大和复杂的AI模型时,急需解决的关键瓶颈。
“晶圆级技术是一种颠覆性的进步,”该论文的第一作者、UCR电气与计算机工程教授Mihri Ozkan表示,“它让拥有数万亿参数的AI模型能以前所未有的速度和效率运行。”
GPU之所以曾成为AI发展的核心工具,在于它们具备强大的并行处理能力,能同时执行成千上万的计算任务,极其适合处理图像、语言和实时数据流。这种并行性,使得自动驾驶车辆能实时感知环境、文本生成图像成为现实、而ChatGPT也能根据一串食材给出丰富多样的食谱建议。
图:晶圆级芯片:驱动下一代AI的超级引擎
然而,随着AI模型参数规模呈指数级增长,即便是顶尖的GPU也开始在性能与功耗上接近极限。
“AI计算如今不仅要追求速度,还要面对散热与能耗的双重挑战,”Ozkan指出,“核心在于如何构建既强大又高效的数据传输架构。”
论文中,UCR团队对比了当前主流GPU芯片与诸如Cerebras最新的第三代晶圆级引擎(WSE-3)等系统。WSE-3集成了高达4万亿个晶体管和90万个专为AI优化的计算核心。另一个例子是特斯拉推出的Dojo D1模块,每个模块拥有约1.25万亿晶体管和近9000个核心。
这些晶圆级系统的优势,在于突破了传统多芯片架构中“芯片间通讯”所带来的延迟与能耗瓶颈。
“将所有计算单元集中在一块晶圆上,可以显著减少数据在多个芯片之间传输时造成的损耗与延迟,”Ozkan解释道,“这不仅提升了性能,更为AI系统的可持续发展奠定了基础。”
简而言之,晶圆级芯片正为下一代AI计算打开新大门,在性能、效率与环保之间找到更好的平衡点,为未来智能系统的演进提供了关键支撑。