首页 > 全部资讯 > 行业新闻 > 英伟达和Oracle联手打造Zettascale集群
芯达茂广告F 芯达茂广告F

英伟达和Oracle联手打造Zettascale集群

集群是由多台计算机组成的组合,它们通过网络连接并运行特定的软件,以实现负载均衡、冗余和高可用性。分布式系统中的集群强调的是系统的可扩展性和容错能力。集群中的每个节点都执行一部分任务,并且集群作为一个整体对外提供服务。如果某个节点失败,其他节点可以接管其工作,从而保证系统的整体稳定性和连续性。

甲骨文公司(Oracle)近日宣布推出了全球首个Zettascale云计算集群,这是一个具有里程碑意义的事件,因为它代表着云计算服务能力的显著提升。这个名为Zettascale的云计算集群计划整合多达131,072块英伟达(NVIDIA)的Blackwell芯片,这样的芯片集成数量将极大提升数据处理速度和效率。这一技术升级预计将显著提升甲骨文在云计算市场的竞争力,并且可能对相关硬件供应商的股价产生积极影响。

据悉,甲骨文的新型超级计算机集群可以配置Nvidia的Hopper或Blackwell GPU用于AI和HPC,以及不同的网络设备。Nvidia 超大规模和高性能计算副总裁 Ian Buck 表示:“随着企业、研究人员和国家竞相利用 AI 进行创新,寻求获得强大的计算集群和 AI 软件。Nvidia 在 Oracle 广泛分布的云上的全栈 AI 计算平台将以前所未有的规模提供 AI 计算能力,以推动全球 AI 工作,并帮助世界各地的组织加速研究、开发和部署。”

图:Oracle推出新型集群,为AI带来大量性能(图源:Oracle)

Zettascale集群的推出,意味着甲骨文现在可以提供高达2.4 ZettaFLOPS的峰值性能,这是通过其云基础设施(OCI)实现的。这个性能水平是前所未有的,它使得甲骨文的云计算服务能够处理最大规模的AI工作负载。此外,这个集群还支持多种GPU,包括NVIDIA H100、H200、B200和GB200,以及NVIDIA的第五代NVLink技术和NVLink Switch,这些都是为了实现GPU之间的高速通信。

甲骨文的这一举措不仅展示了其在高性能计算(HPC)领域的雄心,也为全球的企业和研究人员提供了强大的AI基础设施。这对于需要进行大规模数据处理和复杂计算任务的行业,如医疗、科学研究和金融服务等,都是一个巨大的福音。通过这种高性能的云计算服务,企业可以在保持数据主权的同时,更加灵活和高效地进行AI模型的训练和部署。

值得注意的是,甲骨文的这一宣布是在云计算市场竞争激烈的背景下进行的,其他主要云服务提供商如AWS、Azure和谷歌云也在不断提升自己的服务能力。甲骨文通过这一Zettascale集群的推出,无疑在云计算的高性能计算领域占据了领先地位。

业内人士表示,即将推出的OCI超级集群将使用Nvidia的GB200 NVL72液冷机柜,其中有72个GPU。Oracle公司表示,Nvidia的Blackewell GPU将于2025年上半年上市,但尚不清楚OCI何时会提供满载的Blackwell驱动集群。

总的来说,甲骨文的Zettascale云计算集群的推出,不仅是公司技术实力的展示,也是对整个云计算行业未来发展的一个强有力信号。随着云计算服务能力的不断提升,我们有理由期待更多的创新应用和服务将会出现,进一步推动各行各业的数字化转型。

相关新闻推荐

登录

注册

登录
{{codeText}}
登录
{{codeText}}
提交
关 闭
订阅
对比栏
对比 清空对比栏