订阅

阅读量:

算力惊人!英伟达发布“世界最强AI芯片”Blackwell B200 GPU

2024年3月20日
  • 编辑:Ana Hu
  • 中国出海半导体网

 

美国当地时间3月18日,英伟达(NVIDIA)年度GPU技术大会(GTC)如约而至,期间,黄仁勋介绍了其最新一代的AI芯片,一款被称为“世界上最强大芯片”的Blackwell B200 GPU。这款芯片将进一步提升英伟达的地位,使该公司市值再度提升,甚至超越更多老牌知名科技公司。虽然竞争对手一直在努力追赶,但英伟达可能会凭借新的Blackwell B200 GPU和GB200“超级芯片”进一步扩大其领先优势。

Blackwell B200 GPU拥有惊人的2080亿个晶体管,可提供高达20petaflops的FP4算力。而GB200则将两个GPU和一个Grace CPU结合在一起,为LLM推理工作负载提供了30倍的性能,同时也可能大幅提高效率。相比之下,黄仁勋表示,只需要2000个Blackwell GPU就可以完成以前需要8000个Hopper GPU完成的工作,且电力消耗仅为4兆瓦。

英伟达称,在GPT-3 LLM基准测试中,GB200的性能是H100的7倍,训练速度是H100的4倍。其中一个关键改进是第二代变压器引擎,通过为每个神经元使用四个比特而不是八个比特,将计算能力、带宽和模型大小提高了一倍。此外,新一代NVLink交换机可让576个GPU相互连接,双向带宽达到每秒1.8TB。

图:英伟达Blackwell-GPU算力惊人

图:英伟达Blackwell GPU算力惊人

同时,英伟达还推出了一款全新的网络交换芯片,内含500亿个晶体管和一些自己的板载计算,拥有3.6 teraflops的FP8处理能力。公司还表示,亚马逊、Google、微软和甲骨文都已计划在其云服务产品中提供GB200超级芯片的支持,但具体采购量尚不清楚。

除了GB200超级芯片外,英伟达还推出了用于DGX GB200的DGX Superpod,将八个系统合并成一个,总共拥有288个CPU、576个GPU、240TB内存和11.5 exaflops的FP4计算能力。据称,其系统可扩展至数万GB200超级芯片,并通过其新型Quantum-X800 InfiniBand或Spectrum-X800以太网与800Gbps网络连接在一起。

英伟达的新发布显示了他们在人工智能领域的巨大进步和领先地位。这些新产品的性能和效率提高将为AI应用的发展提供强大支持,尤其是在训练大型模型方面。此外,他们提供的解决方案如NVL72机架和DGX GB200将使企业能够更轻松地实现规模化的AI计算,这对于大型科技公司和云服务提供商来说是一个巨大的吸引力。

然而,这些新技术也带来了一些挑战,如安全性和能源消耗。尽管NVIDIA表示新产品在成本和能耗方面有所降低,但对于大规模部署来说,这些仍然是需要考虑的问题。另外,新技术的大规模部署还可能面临一些技术和市场上的障碍。