O novo projeto, xAI, de Elon Musk, o empreendedor bilionário por trás da Tesla e da SpaceX, lançou um poderoso sistema de treinamento de IA chamado Colossus, de acordo com um tuíte no X ontem, 2 de setembro. Este sistema é tão avançado que estabeleceu um novo padrão no subsetor de inteligência artificial.
Colossus é um sistema de treinamento de IA que usa incríveis 100 mil unidades de processamento gráfico (GPUs) Nvidia H100. Para simplificar, as GPUs são como o cérebro de um computador, e ter 100.000 delas torna o Colossus incrivelmente poderoso. A equipe de Elon Musk na xAI construiu esse sistema em apenas 122 dias, o que é uma conquista notável.
Neste fim de semana, a equipe @xAI colocou nosso cluster de treinamento Colossus 100k H100 online. Do início ao fim, foi feito em 122 dias. O Colossus é o sistema de treinamento de IA mais poderoso do mundo. Além disso, ele dobrará de tamanho para 200k (50k H200s) em alguns meses. Excelente…
— Elon Musk (@elonmusk) 2 de setembro de 2024
O Colossus é importante porque agora é o sistema de treinamento de IA mais poderoso do mundo. Ele supera outros modelos importantes, incluindo os da OpenAI, que usa 80.000 GPUs. Isso significa que o Colossus pode processar mais dados e aprender mais rápido do que qualquer outro sistema de IA existente.
Fonte da imagem: X (antigo Twitter)
O papel da Nvidia e as especificações do Colossus
A Nvidia, uma empresa líder na fabricação de chips de computador, fez uma parceria com a xAI para construir o Colossus. As GPUs H100 da Nvidia são algumas das melhores do mercado e desempenham um papel sensível em tornar o Colossus tão poderoso. Você deve se lembrar que a Coinfomania relatou que a Nvidia sofreu um revés no lançamento de seu chip de inteligência artificial “Blackwell” B-200 de próxima geração no início de agosto deste ano. A Nvidia e seu CEO, Jensen Huang, parabenizaram Musk e sua equipe, dizendo: “Esta é uma grande conquista no campo da IA”.
É emocionante ver o Colossus, o maior#supercomputadorde GPU do mundo, ficar online em tempo recorde. O Colossus é alimentado pela plataforma de #computaçãoacelerada da @nvidia, proporcionando desempenho inovador com ganhos excepcionais em #eficiênciaenergética. Parabéns a toda a equipe! https://t.co/UXHtPCELly
— NVIDIA Data Center (@NVIDIADC) 2 de setembro de 2024
O Colossus usa 100k unidades de processamento gráfico (GPUs) Nvidia H100. Essas GPUs são resfriadas a líquido e conectadas por meio de uma única malha RDMA (Remote Direct Memory Access). O consumo de energia do sistema é estimado entre 42 e 56 megawatts. A fase inicial fornece 50 megawatts, com planos de escalar até 150 megawatts. O supercomputador Colossus está localizado na antiga instalação da Electrolux em Memphis, Tennessee.
Memphis foi escolhida por sua infraestrutura de energia robusta, apoiada pela Memphis Light, Gas, and Water (MLGW) e pela Tennessee Valley Authority (TVA). A cidade ofereceu pacotes de desenvolvimento econômico atrativos, reconhecendo o potencial do projeto para transformar Memphis em um centro de tecnologia. A antiga instalação da Electrolux, adquirida pela Phoenix Investors, forneceu um espaço industrial pronto para uso, acelerando o cronograma do projeto.
O Projeto Colossus é um precursor
Os planos do projeto indicam uma abordagem em fases para o uso de energia, começando com 50 megawatts disponíveis até agosto de 2024 e, finalmente, visando 150 megawatts. Espera-se que a instalação xAI seja um investimento multibilionário e o maior investimento de empresa novata no mercado na história de Memphis.
Elon Musk tem grandes planos para o Colossus. Ele anunciou que o sistema dobrará de tamanho nos próximos meses, atingindo 200.000 GPUs ao incorporar mais 50.000 GPUs H200. Isso tornará o Colossus ainda mais poderoso e capaz de lidar com tarefas mais complexas.
Impressionante! Parabéns a você e ao resto da equipe @xai pelo primeiro de muitos grandes anúncios que virão. https://t.co/AImAsrIiAN
— Cathie Wood (@CathieDWood) 2 de setembro de 2024
A comunidade de IA está agitada de excitação com o Colossus. Cathie Wood, CEO da ARK Invest, chamou-o de "impressionante" e sugeriu "grandes anúncios à frente". Muitos especialistas acreditam que o Colossus vai expandir os limites do que a IA pode fazer e levar a avanços tecnológicos.
A postagem xAI Colossus de Elon Musk estabelece novo padrão em IA com 100.000 GPUs ao entrar no ar apareceu primeiro em Coinfomania.