根据Meta官方信息,Meta正以人工智能为核心,构建下一代的大规模基础设施,这包括支持新的生成式AI产品服务、推荐系统,以及进行先进的AI研究。随着AI模型的日益复杂和对计算能力需求的增加,预计在未来几年这项投资将继续扩大。
去年,Meta推出了第一代AI推理加速器——Meta训练与推理加速器(MTIA)v1。这款加速器是Meta自主研发的,专为公司的AI工作负载设计,特别是针对深度学习推荐模型,这些模型正在改善我们产品中的多样化体验。
MTIA项目是Meta为了满足其独特工作负载需求而进行的长期投资,旨在提供最高效的架构解决方案。随着AI工作负载在我们的产品和服务中变得越来越关键,这种高效性能将增强为全球用户提供卓越体验的能力。MTIA v1在提升基础设施的计算效率以及更好地支持软件开发人员构建能够带来新的、更优用户体验的AI模型方面,迈出了更重要的进步。
此前Meta承诺下一代定制AI芯片将更加强大,并能够更快地训练其排名模型。该公司在一篇文章中表示,MTIA是其长期计划中的一大块,旨在围绕其服务中如何使用AI来构建基础设施。其负责人表示:“实现我们对定制硅的雄心意味着不仅需要投资于计算硅,还需要投资于内存宽带、网络和容量以及其他下一代硬件系统。”
图一:Meta推出新款MTIA
Meta在2023年5月宣布了MTIA v1,重点是向数据中心提供这些芯片。下一代MTIA芯片也可能同样以数据中心为目标。MTIA v1原本预计要到2025年才会发布,但Meta表示两种MTIA芯片现在已经在生产中。
目前,MTIA主要用于训练排名和推荐算法,但Meta表示,其目标是最终扩展芯片的能力,开始训练生成式AI,如其Llama语言模型。
Meta公司强调,新款MTIA芯片“本质上专注于在计算能力、内存带宽和内存容量之间实现恰当的平衡”。与第一代的128MB内存和800GHz频率相比,这款新芯片将配备256MB的片上内存和1.3GHz的时钟频率。
随着AI应用的增加,对计算能力的需求也在增长,其他AI领域的公司也在探索制造自己的芯片。谷歌在2017年推出了其新的TPU芯片,微软宣布了Maia 100芯片,而亚马逊则推出了Trainium 2芯片,后者的训练速度比前一代快了四倍。
对于高性能芯片的争夺凸显了定制芯片在运行AI模型中的重要性。随着芯片需求的激增,目前主导AI芯片市场的英伟达公司的市值已经达到了2万亿美元。Meta公司已经在MTIA v2项目上投入了相当长的时间。之前有报道称它主要关注于推理功能,旨在提高AI应用的性能和效率。MTIA芯片采用先进的制造工艺,最新采用5nm工艺,相较于前一代的7nm工艺有所提升。此外,Meta公司表示,新款MTIA芯片的性能是前一代产品的三倍,这表明了其AI领域的显著进步和对提升自身技术实力的承诺。通过这款芯片,Meta希望能够减少对其他芯片供应商如英伟达的依赖,并加强自身在AI领域的竞争力。新款MTIA芯片已经在Meta的数据中心部署,并开始为AI应用提供服务。