Der Chiphersteller Ampere Computing hat eine Partnerschaft mit Qualcomm zur Entwicklung eines KI-Servers der neuen Generation angekündigt, der die CPUs von Ampere und den AI Cloud AI 100 Ultra-Inferenzchip verwendet und hohe Leistung und Energieeinsparungen verspricht.

In der Entwicklungs-Roadmap für das nächste Jahr überraschte Ampere Computing – ein Unternehmen, das sich auf die Herstellung von ARM-Chips für Rechenzentrumsserver spezialisiert hat – mit der Ankündigung einer Partnerschaft mit Qualcomm, einem Namen, der für seine mobilen Chips bekannt ist.

Der Zusammenschluss zielt darauf ab, die Stärken beider Seiten zu nutzen, um eine neue Reihe von KI-Inferenzservern zu schaffen, die die CPU von Ampere und den Cloud AI 100 Ultra-Chip von Qualcomm verwenden. Diese Lösung ist darauf ausgelegt, große KI-Modelle, insbesondere große Sprachmodelle (LLMs) und generative KI-Anwendungen, effizient und energieeffizient auszuführen.

Laut Jeff Wittich, Chief Technology Officer bei Arm: „Wir haben mit Qualcomm zusammengearbeitet, um eine Lösung auf Serverniveau zu entwickeln, die Ampere-CPUs effektiv mit ihren Hochleistungskarten kombiniert.“ Dies ist nicht nur eine allgemeine Entwicklung, sondern eine Revolution in der Art und Weise, wie wir mit KI umgehen.“

Testergebnisse zeigen, dass das Llama 3-Sprachmodell von Meta, das auf einer Ampere-CPU in der Oracle Cloud läuft, die gleiche Leistung wie die Nvidia A100-GPU erreicht, aber weniger Strom verbraucht. Ampere und Qualcomm glauben, dass der neue Server eine attraktive Wahl für Unternehmen sein wird, die nach leistungsstarken und energieeffizienten KI-Lösungen suchen.

Darüber hinaus stellte Ampere auch den neuen AmpereOne-Chip mit 256 Kernen vor, der in einem fortschrittlichen 3-nm-Prozess hergestellt wird und 12-Kanal-DDR5-RAM unterstützt, sodass Kunden von Rechenzentren den Speicherzugriff flexibel an ihre Bedürfnisse anpassen können.

Darüber hinaus arbeitete Ampere auch mit NETINT zusammen, um eine Lösung zu entwickeln, die seine CPU mit dem Videoverarbeitungschip von NETINT kombiniert. Der neue Server ist in der Lage, 360 Live-Videokanäle parallel zu kodieren und nutzt das Text-to-Speech-Modell Whisper von OpenAI, um Untertitel für 40 Videostreams zu generieren.

Diese Kooperationen verdeutlichen die Bemühungen von Ampere, den Markt über den traditionellen Rechenzentrumssektor hinaus hin zu KI-Anwendungen in den Bereichen Medien, Unterhaltung, Einzelhandel und Fertigung zu erweitern.