Zpráva Foresight News, podle oficiálního blogu Google, Google vydal novou generaci umělého inteligentního modelu Gemini 2.0. Gemini 2.0 podporuje multimodální vstupy jako text, obrázky, video a audio, a má nativní generování obrázků, vícejazyčný převod textu na řeč (TTS) a další multimodální výstupní funkce. Ve srovnání s modelem Gemini 1.5 Pro se rychlost modelu zvýšila na dvojnásobek a byly optimalizovány multimodální inference, provádění složitých příkazů a schopnost využívání nástrojů, s podporou volání Google vyhledávání, provádění kódu a funkcí třetích stran. Experimentální verze Gemini 2.0 Flash je nyní otevřena pro vývojáře a v lednu 2025 bude plně propagována multimodální funkce a uvedena multimodální API v reálném čase, aby vývojářům poskytla více podpory pro aplikace.