Технологічна компанія Google оголосила про запуск Gemini 2.0, останньої AI-моделі у своїй родині Gemini, починаючи з експериментальної версії під назвою Gemini 2.0 Flash.
Будучи на успіху Gemini 1.5 Flash, який став улюбленцем серед розробників, Gemini 2.0 Flash забезпечує покращену продуктивність, зберігаючи швидкі часи відгуку. Зокрема, нова модель перевершує 1.5 Pro у ключових бенчмарках удвічі швидше. Крім того, Gemini 2.0 Flash представляє розширені можливості, включаючи підтримку мультимодальних входів, таких як зображення, відео та аудіо, а також мультимодальних виходів, таких як текст у поєднанні з AI-генерованими зображеннями та кероване багатомовне текстово-мовне (TTS) аудіо. Ця модель AI також може нативно викликати інструменти, такі як Google Search, виконувати код і отримувати доступ до функцій сторонніх розробників, визначених користувачем.
Наразі доступний для розробників через Gemini API у Google AI Studio та Vertex AI, експериментальна версія 2.0 Flash підтримує мультимодальний вхід з текстовим виходом. Розширені можливості, такі як текст в мовлення та нативна генерація зображень, доступні для партнерів з раннім доступом, з ширшою доступністю, очікуваною в січні разом з додатковими розмірами моделі.
Щоб ще більше підтримати розробників у створенні динамічних, інтерактивних додатків, Google також представляє новий Мультимодальний API для живих додатків. Цей API дозволяє вводити аудіо та відеопотоки в реальному часі, а також має можливість інтегрувати кілька інструментів для комбінованої функціональності.
Починаючи з сьогоднішнього дня, користувачі по всьому світу можуть спробувати експериментальну версію Gemini 2.0 Flash, оптимізовану для чату, вибравши її з випадаючого списку моделей на платформах настільних і мобільних веб-додатків. Модель також буде доступна в мобільному додатку Gemini найближчим часом.
Google досліджує можливості Gemini 2.0 Flash через дослідницькі проекти
Gemini 2.0 Flash представляє вдосконалені можливості, які покращують взаємодії з користувачами, включаючи мультимодальне мислення, розуміння довгих контекстів, обробку складних інструкцій, планування, складні виклики функцій і безшовну інтеграцію з нативними інструментами. Ці функції, в поєднанні з покращеною затримкою, працюють разом, щоб створити основу для нового покоління автономних AI-вражень.
В даний час Google досліджує, як AI-агенти можуть допомагати людям з реальними завданнями через прототипи, розроблені для підвищення продуктивності та оптимізації робочих процесів. Прикладами є оновлений Проект Астра, дослідницька ініціатива, спрямована на потенційні можливості універсального AI-асистента, новий Проект Марино, який переосмислює взаємодію людина-агент, починаючи з браузерних вражень, і Джулс, AI-орієнтований асистент кодування, створений для підтримки розробників у їхній роботі. Використовуючи Gemini 2.0 Flash у цих проектах, Google змогла ефективно оцінити його можливості та досягти покращених результатів, підкреслюючи величезний потенціал нової моделі.
Пост Google представляє AI-модель Gemini 2.0 Flash, тепер доступну для розробників, вперше з'явився на Metaverse Post.