随着人工智能技术的快速发展,大型语言模型和生成式AI的需求正在推动计算硬件的变革。然而,目前高性能GPU和CPU的高功耗、高成本和复杂性,已经成为AI推理广泛应用的最大障碍。为了解决这个问题,初创公司Sagence AI推出了一项颠覆性的新技术,通过模拟存内计算架构,重新定义了AI推理硬件的可能性。
什么是模拟存内计算?
简单来说,模拟存内计算是一种将数据存储和计算功能合二为一的技术。传统硬件需要将数据在存储器和处理器之间来回传输,不仅耗电,还增加了延迟。Sagence AI 的技术直接在存储单元中完成计算,省去了这些步骤,从而大幅提高能效和性能。
Sagence AI的优势在哪里?
1.超高能效
相比当前市场上用于AI推理的主流GPU,Sagence的技术能耗降低了10倍。
2.极低成本
Sagence技术的成本只有传统方案的 1/20,使AI推理的经济性显著提升。
3. 节省空间
模块化芯粒设计使得设备占用的空间缩小了 20倍,为数据中心带来更多灵活性。
4.高性能
在处理 Llama2-70B 这样的大型语言模型时,Sagence的性能与高端GPU相当,但更高效、更环保。
为什么这项技术重要?
如今,AI模型的复杂度越来越高,计算需求也随之飙升。传统硬件虽然性能强大,但功耗问题严重。举个例子,现在最强大的GPU功耗已达到 1200瓦,和传统家用电器比简直是天文数字。这不仅增加了运营成本,还对环境造成了巨大的负担。
图:Sagence AI:用创新模拟计算推动AI推理的未来(图源:Sagence AI)
Sagence AI通过模拟计算找到了突破口。相比数字计算,模拟计算功耗低、延迟小,而且可以利用现有的成熟技术制造。这种创新为AI推理在数据中心和边缘设备上的大规模应用扫清了障碍。
面向未来的AI推理架构
Sagence的创始人兼CEO Vishal Sarin 表示:“AI的未来需要全新的推理硬件。现有的高性能设备太贵、太耗电,已经无法满足规模化应用的需求。我们的目标是提供一种高效、经济且环保的解决方案。”
更重要的是,Sagence并不把AI推理看作普通的通用计算任务,而是将其视为一个数学密集型问题。他们的硬件设计理念更加贴近生物神经网络的工作方式,提供了一个自然且高效的解决方案。
从数据中心到边缘设备,全面覆盖
无论是数据中心运行的大型语言模型,还是边缘设备上的计算机视觉应用,Sagence的技术都能胜任。这种灵活性使它在多个行业中具有广泛的应用潜力,比如医疗、自动驾驶、智能制造等。
Sagence AI的创新模拟存内计算技术,是一次对传统AI推理硬件的大胆挑战。它让大规模AI推理变得更高效、更实惠、更可持续。未来,随着这项技术的进一步发展,我们或许能看到AI的普及速度大幅提升,同时还能为地球的环保事业做出贡献。