V blogovém příspěvku z 29. března Elon Musk oznámil vydání upgradované verze chatbota Grok příští týden. Tato verze bude předem k dispozici pro první testery a stávající uživatele Groku na platformě sociálních médií.

Grok-1.5 je vylepšená verze Grok-1, zlepšující vyvozování a dokáže zpracovat kontexty dlouhé až 128 000 slov. Analýza xAI také ukazuje, že chatboti také vykazují vynikající výkon v úkolech souvisejících s kódováním a matematikou.

Grok-1.5 je však stále horší než Gemini Pro 1.5 od Googlu a GPT-4 od OpenAI. Podle výzkumu Grok-1.5 dosáhl pouze 50,6 % v benchmarku MATH a 90 % v benchmarku GSM8K, to jsou dva benchmarky, které hodnotí schopnost řešit matematiku na úrovních od základní po střední školu.

Kromě toho tento virtuální asistent dosáhl pouze 74,1 % v benchmarku HumanEval, který se používá k hodnocení schopností vytváření kódu a řešení problémů.

Analýza AI Chatbot. (Zdroj: xAI)

xAI dodal, že Grok-1.5 je postaven na vlastní distribuované školicí platformě založené na JAX, Rust a Kubernetes, což týmu xAI usnadňuje vytváření nápadů a školení nových architektur ve velkém.

Začátkem tohoto měsíce udělala xAI významný krok kupředu tím, že volně získávala kódovou základnu Grok-1. Rozhodnutí vychází z právního případu, který Musk zahájil proti OpenAI, organizaci, kterou kdysi spoluzakládal. Musk obvinil OpenAI, že se odchýlila od svého původního závazku upřednostňovat vývoj open source před zájmy akcionářů.

Vydaný zdrojový kód je hrubým základním modelovým testem z fáze předběžného školení Grok-1, dokončené v říjnu 2023. To znamená, že model není doladěn pro žádnou konkrétní aplikaci, jako je konverzace.