Teslas Dojo-Prozessor ist in die Massenproduktion gegangen und wird bald eingesetzt. Dojo ist ein System auf einem Waferprozessor, der aus einer 5x5-Reihe einzelner Prozessorchips besteht, die auf einem anderen Wafer, einem sogenannten Trägerwafer, befestigt sind und durch die InFo-Technologie für Waferverbindungen von Taiwan Semiconductor miteinander verbunden sind. Klingt kompliziert? Lassen Sie es uns vereinfachen.

Teslas Dojo wird bald in Betrieb genommen

Tesla Dojo Training Tile (das Unternehmen nennt es Training Tile) ist eigentlich ein Paket aus 25 leistungsstarken Prozessoren, die zu einem einzigen ultrastarken Prozessor zusammengefügt sind und dabei die speziell für Hochgeschwindigkeitsverbindungen entwickelte Konnektivitätstechnologie von TSMC nutzen. Jetzt ergibt das Ganze ein wenig Sinn, aber zuerst ein paar Hintergrundinformationen dazu, warum Tesla einen eigenen Prozessor brauchte, wenn Halbleitergiganten wie Nvidia, IBM und Intel bereits Hardware für Computer und KI herstellten.

Teslas Entscheidung, in die Bereiche KI, Chipdesign und Supercomputing einzusteigen, zeigt, dass das Unternehmen und insbesondere Elon Musk Innovation als mehr als nur eine Geschäftserweiterung betrachten. Tesla versucht von Anfang an, selbstfahrende Autos zu entwickeln, und alle verkauften Autos übermitteln Daten an Tesla, um dem Unternehmen beim Aufbau des Systems zu helfen. Dojo ist also auch ein Teil seiner vertikalen Integration.

Dojo unterscheidet sich deutlich von anderen verfügbaren KI-Beschleunigern und Tools für Supercomputing. Beispielsweise sind die GPUs A100 oder A200 von Nvidia in vielen Supercomputern auf der ganzen Welt integriert, aber diese und die anderen sind hauptsächlich für ein breites Aufgabenspektrum konzipiert, darunter Forschung, Verarbeitung großer Datenmengen, komplexe Simulationen und vieles mehr. Dojo ist jedoch für eine spezielle Aufgabe wie KI-Computervision auf der Grundlage realer Daten konzipiert. Was Dojo sonst noch kann, ist unbekannt, da das Unternehmen nicht viel verraten hat.

Waferbasierte Systeme sind effizienter

Quelle: TSMC.

Wie bereits erwähnt, besteht Dojo aus 25 einzelnen Hochleistungsprozessoren, hat also einen enormen Leistungshunger und benötigt ein effektives und ausgeklügeltes Kühlsystem. Laut Toms Hardware verwendet Tesla zur Stromversorgung ein Spannungsregulierungssystem, das selbst ein komplexes Modul ist, das dem Prozessor 18.000 Ampere Leistung liefert. Bei dieser hohen Leistung leitet das System 15.000 Watt Wärme ab und benötigt für einen effizienten Betrieb ein Flüssigkeitskühlsystem.

Waferbasierte Beschleuniger wie Teslas Dojo sind wesentlich effektiver und leistungsfähiger als andere Multiprozessorsysteme. Sie profitieren von geringer Latenz zwischen den Kommunikationskernen, hoher Bandbreite und besserer Energieeffizienz dank der Wafertechnologie des Systems.

Bisher haben nur Tesla und Cerebras Systeme auf Wafer-Designs, aber aufgrund der höheren Effizienz und geringeren Latenz wird erwartet, dass auch andere Branchenakteure einsteigen. Allerdings gibt es auch bei diesen Beschleunigern einige Einschränkungen; Wafersysteme sind derzeit auf On-Chip-Speicher angewiesen, der normalerweise fest ist und für verschiedene Arten von Anwendungsfällen unzureichend sein kann. Es wird jedoch erwartet, dass dies überwunden wird, wenn die nächste Generation von On-Wafer-Plattformen das 3D-Stapeln von HBM4-Speicherchips auf Beschleunigerkacheln ermöglicht.