O processador Dojo da Tesla passou para produção em massa e será implantado em breve. Dojo é um sistema em um processador wafer que consiste em uma série 5 por 5 de chips de processador individuais que são fixados em outro wafer chamado wafer de portadora e são interconectados pela tecnologia InFo da Taiwan Semiconductor para interconexões de wafer. Parece complexo? Vamos simplificar.

O Dojo da Tesla será implantado em breve

Tesla Dojo Training Tile (a empresa o chama de bloco de treinamento) é na verdade um pacote de 25 processadores poderosos que são unidos para atuar como um processador ultrapoderoso, utilizando a tecnologia de conectividade da TSMC, que é projetada especificamente para conectividade de alta velocidade. Agora começou a fazer um pouco de sentido, mas primeiro vamos explicar por que a Tesla precisava de seu próprio processador quando gigantes de semicondutores como Nvidia, IBM e Intel já fabricavam hardware para computadores e IA.

A decisão da Tesla de entrar na IA, no design de chips e na supercomputação mostra como a empresa, e especialmente Elon Musk, vê a inovação como mais do que apenas a expansão dos negócios corporativos. A Tesla está tentando desenvolver carros com capacidade de direção autônoma desde o início, e todos os carros que vende transmitem dados à Tesla para ajudar a empresa a construir o sistema. Portanto, o Dojo também faz parte de sua integração vertical.

Dojo é bastante diferente de outros aceleradores e ferramentas de IA disponíveis para supercomputação. Por exemplo, as GPUs A100 ou A200 da Nvidia estão incorporadas em muitos supercomputadores em todo o mundo, mas estes e outros são principalmente projetados para atender a uma ampla gama de tarefas, incluindo pesquisa, processamento de big data, simulações complexas e muito mais. Mas o Dojo foi projetado para uma tarefa específica, como visão computacional de IA orientada por dados do mundo real; não se sabe do que mais o Dojo será capaz, já que a empresa não revelou muito.

Sistemas baseados em wafer são mais eficientes

Fonte: TSMC.

Como dito acima, o Dojo consiste em 25 processadores individuais de alto desempenho, por isso tem um apetite voraz por energia e requer um sistema de resfriamento eficaz e sofisticado. De acordo com o hardware de Tom, para alimentar a energia, Tesla usa um sistema regulador de tensão, que por si só é um módulo complexo que fornece 18.000 amperes de energia ao processador. Com esses altos níveis de potência, o sistema dissipa 15.000 watts de calor e, para funcionar com eficiência, requer um sistema de refrigeração líquida.

Aceleradores baseados em wafer, como o Dojo da Tesla, são substancialmente mais eficazes e oferecem melhor desempenho do que outros sistemas multiprocessadores. Eles se beneficiam de baixa latência entre os núcleos de comunicação, alta largura de banda e melhor eficiência energética devido à tecnologia wafer do sistema.

Até agora, apenas a Tesla e a Cerebras têm sistemas baseados em designs de wafer, mas espera-se que outros participantes da indústria também entrem devido à maior eficiência e menor latência. No entanto, também existem algumas limitações para esses aceleradores; Atualmente, os sistemas wafer dependem de memória no chip, que geralmente é fixa e pode ser insuficiente para diferentes tipos de casos de uso. Mas espera-se que isso seja superado quando a próxima geração da plataforma wafer permitir o empilhamento 3D de chips de memória HBM4 em blocos aceleradores.