Během akce Google Cloud Next ’24 v Las Vegas představila služba Google Cloud (GCP) řadu nových funkcí, zejména vlastní čip Axion založený na Arm a akcelerátory AI.

Pokud jde o akceleraci AI, Google bude spolupracovat s Nvidií na integraci platformy Nvidia Blackwell, která by měla být uvedena na trh v roce 2025, včetně superrychlého GPU HGX B200 a NBL72 GB200, GPU, které je ideální pro výkonově náročné úkoly AI až po velké tréninky jazykové modely (LLM).

Pro aktuální potřeby školení LLM představuje Google A3 Mega – kombinaci standardního GPU H100 a nové sítě, která poskytuje dvojnásobnou šířku pásma na GPU. Další variantou je A3 Confidential, která upřednostňuje zabezpečení citlivých dat a šifruje data end-to-end během přenosu mezi procesory Intel.

Google také představil Cloud TPU v5p, nejvýkonnější procesor s akcelerací AI vyvinutý společností, s dvojnásobným výpočetním výkonem s plovoucí desetinnou čárkou a trojnásobnou šířkou pásma paměti ve srovnání s předchozí generací.

Kromě čipů nabízí Google také možnosti úložiště optimalizované pro umělou inteligenci, jako je Hyperdisk ML, který může zkrátit dobu načítání modelu až 3,7krát.

Kromě toho Google také představí nové univerzální instance C4 a N4, poháněné procesory Intel Xeon 4. a 5. generace, spolu se stroji C3, verzemi s pamětí X4 a virtuálním strojem Z3 optimalizovaným pro úložiště.

Inovace na Google Cloud Next ’24 demonstrují odhodlání Google Cloud poskytovat zákazníkům nejvýkonnější, nejflexibilnější a nejefektivnější řešení cloud computingu.