In einem Blogbeitrag vom 29. März kündigte Elon Musk die Veröffentlichung einer aktualisierten Version des Grok-Chatbots nächste Woche an. Diese Version wird vorab für frühe Tester und bestehende Grok-Benutzer auf der Social-Media-Plattform verfügbar sein.

Grok-1.5 ist eine erweiterte Version von Grok-1, die die Inferenz verbessert und Kontexte mit einer Länge von bis zu 128.000 Wörtern verarbeiten kann. Die xAI-Analyse zeigt außerdem, dass Chatbots auch bei Aufgaben im Zusammenhang mit Codierung und Mathematik eine überlegene Leistung erbringen.

Allerdings ist Grok-1.5 immer noch schlechter als Googles Gemini Pro 1.5 und OpenAIs GPT-4. Untersuchungen zufolge erzielte Grok-1.5 beim MATH-Benchmark nur 50,6 % und beim GSM8K-Benchmark 90 %. Dabei handelt es sich um zwei Benchmarks, die die mathematische Lösungsfähigkeit auf Niveaus von der Grundschule bis zur Oberstufe bewerten.

Darüber hinaus erreichte dieser virtuelle Assistent beim HumanEval-Benchmark, der zur Bewertung der Codeerstellungs- und Problemlösungsfähigkeiten verwendet wird, nur 74,1 %.

Analyse des KI-Chatbots. (Quelle: xAI)

xAI fügte hinzu, dass Grok-1.5 auf einer benutzerdefinierten verteilten Trainingsplattform basiert, die auf JAX, Rust und Kubernetes basiert, was es dem xAI-Team erleichtert, Ideen zu generieren und neue Architekturen in großem Maßstab zu trainieren.

Anfang dieses Monats hat xAI durch die Open-Source-Bereitstellung der Grok-1-Codebasis einen bedeutenden Schritt nach vorne gemacht. Die Entscheidung geht auf einen von Musk eingeleiteten Rechtsstreit gegen OpenAI zurück, die Organisation, die er einst mitbegründet hatte. Musk warf OpenAI vor, von seiner ursprünglichen Zusage abgewichen zu sein, der Open-Source-Entwicklung Vorrang vor den Interessen der Aktionäre einzuräumen.

Der veröffentlichte Quellcode ist ein grober Basismodelltest aus der Vortrainingsphase von Grok-1, die im Oktober 2023 abgeschlossen wurde. Das bedeutet, dass das Modell nicht auf eine bestimmte Anwendung, beispielsweise Konversation, abgestimmt ist.