Foresight News informuje, że według oficjalnego bloga Google, Google wydał nową generację modelu sztucznej inteligencji Gemini 2.0. Gemini 2.0 obsługuje multimodalne wejścia, takie jak tekst, obraz, wideo i audio, oferując natywną generację obrazów oraz funkcje tekstu na mowę (TTS) w wielu językach. W porównaniu do Gemini 1.5 Pro, prędkość modelu wzrosła do dwóch razy, a także zoptymalizowano wnioskowanie multimodalne, wykonywanie złożonych poleceń i zdolności korzystania z narzędzi, wspierając wywoływanie wyszukiwania Google, wykonywanie kodu i funkcji osób trzecich. Wersja eksperymentalna Gemini 2.0 Flash jest już dostępna dla deweloperów, a w styczniu 2025 roku multimodalne funkcje zostaną w pełni wprowadzone oraz uruchomione multimodalne API w czasie rzeczywistym, aby zapewnić deweloperom więcej wsparcia aplikacyjnego.