W poście na blogu z 29 marca Elon Musk ogłosił wydanie w przyszłym tygodniu ulepszonej wersji chatbota Grok. Ta wersja będzie dostępna z wyprzedzeniem dla wczesnych testerów i obecnych użytkowników Groka na platformie mediów społecznościowych.

Grok-1.5 to ulepszona wersja Grok-1, poprawiająca wnioskowanie i obsługująca konteksty o długości do 128 000 słów. Analiza xAI pokazuje również, że chatboty wykazują się również doskonałą wydajnością w zadaniach związanych z kodowaniem i matematyką.

Jednak Grok-1.5 jest nadal gorszy od Google Gemini Pro 1.5 i GPT-4 OpenAI. Według badań Grok-1.5 uzyskał jedynie 50,6% w teście MATH i 90% w teście GSM8K. Są to dwa testy oceniające umiejętność rozwiązywania problemów matematycznych na poziomach od szkoły podstawowej do średniej.

Ponadto ten wirtualny asystent uzyskał jedynie 74,1% w teście HumanEval, używanym do oceny umiejętności tworzenia kodu i rozwiązywania problemów.

Analiza Chatbota AI. (Źródło: xAI)

xAI dodało, że Grok-1.5 jest zbudowany na niestandardowej rozproszonej platformie szkoleniowej opartej na JAX, Rust i Kubernetes, co ułatwia zespołowi xAI generowanie pomysłów i szkolenie nowych architektur na dużą skalę.

Na początku tego miesiąca firma xAI poczyniła znaczący krok naprzód, udostępniając na zasadach open source bazę kodu Grok-1. Decyzja ta wynika ze sprawy sądowej wszczętej przez Muska przeciwko OpenAI, organizacji, której kiedyś był współzałożycielem. Musk oskarżył OpenAI o odejście od swojego początkowego zobowiązania do przedkładania rozwoju open source nad interesy akcjonariuszy.

Opublikowany kod źródłowy to przybliżony test modelu podstawowego z fazy przedszkoleniowej Grok-1, zakończonej w październiku 2023 r. Oznacza to, że model nie jest dostosowany do żadnego konkretnego zastosowania, np. konwersacji.