在拉斯维加斯举行的 Google Cloud Next ’24 活动期间,Google Cloud (GCP) 推出了一系列新功能,其中最引人注目的是基于 Arm 的客制化 Axion 晶片和 AI 加速器。

在AI加速方面,Google将与Nvidia合作,整合预计于2025年推出的Nvidia Blackwell平台,包括超快的HGX B200 GPU和NBL72 GB200,该GPU非常适合训练大型AI任务。

为了满足当前的 LLM 培训需求,Google 推出了 A3 Mega——标准 H100 GPU 和新网路的组合,为每个 GPU 提供双倍的频宽。另一种变体是 A3 Confidential,它优先考虑敏感资料的安全性,在 Intel CPU 之间传输期间对资料进行端对端加密。

谷歌也推出了该公司开发的最强大的AI加速处理器Cloud TPU v5p,与上一代系统相比,浮点运算效能提高了一倍,记忆体频宽提高了三倍。

除了晶片之外,Google还提供了 AI 最佳化的储存选项,例如 Hyperdisk ML,它可以将模型载入时间缩短多达 3.7 倍。

此外,Google还将推出新的通用C4和N4实例,由英特尔第四代和第五代Xeon处理器提供支持,以及C3裸机、X4记忆体优化的裸机版本和针对储存优化的Z3虚拟机。

Google Cloud Next '24 的创新体现了 Google Cloud 致力于为客户提供最强大、灵活和高效的云端运算解决方案的承诺。