Google випустив дві стабільні версії моделей API Gemini 1.5 для розробників, обіцяючи більшу продуктивність і нижчі витрати на створення додатків.

24 вересня Google оголосив про запуск стабільних версій Gemini 1.5 Pro (gemini-1.5-pro-002) і Gemini 1.5 Flash (gemini-1.5-flash-002). Порівняно з попередніми моделями 001, нові готові до виробництва моделі Gemini продемонстрували значні покращення у створенні коду, математиці, аргументації та аналізі відео, зокрема. 

Опис моделей Google Gemini 1.5 Flash і Pro. Джерело: Google AI for Developers

Gemini 1.5 Pro знижує фінансові бар'єри для розробників

Google знизив ціну на свою готову до виробництва модель Gemini 1.5 Pro більш ніж на 50%, заявивши, що втричі вищі ліміти швидкості та менша затримка, ніж у попередніх випусках експериментальних моделей.

Джерело: Google DeepMind

Згідно з примітками до випуску Google, обидві моделі Gemini 1.5 пропонують суттєві переваги в фактичності та зменшують галюцинації моделі, слідування інструкціям, багатомовне розуміння 102 мовами, генерацію SQL і розуміння аудіо та документів.

Порівняння продуктивності нових і старих випусків моделі Gemini 1.5. Джерело: Google для розробників

Google зменшив довжину резюмації для обох моделей і порадив розробникам продукту, що базується на чаті, запропонувати варіанти для збільшення можливостей розмови API.

З 1 жовтня ціни на Gemini 1.5 Pro API для підказок менше 128 000 токенів будуть знижені до 64% ​​для вхідних токенів, 52% для вихідних токенів і 64% для інкрементних кешованих токенів. 

«Щоб розробникам було ще простіше створювати за допомогою Gemini, ми збільшуємо ліміти платних рівнів для 1.5 Flash до 2000 об/хв і збільшуємо 1.5 Pro до 1000 об/хв з 1000 і 360 відповідно», — йдеться в повідомленні.

Нові ціни на Google Gemini 1.5 Pro. Джерело: Google для розробників 

Google запускає експериментальну версію Gemini 1.5 Flash 

Google також оголосив про запуск Gemini 1.5 Flash-8B, меншої експериментальної версії 1.5 Flash із нижчими показниками тестування. Це оновлення передбачає значне підвищення продуктивності як для текстових, так і для мультимодальних випадків використання. 

Наразі всі версії доступні в Google AI Studio та Gemini API. 

Тим часом, найбільший конкурент Google у сфері штучного інтелекту, OpenAI, почав розгортати свою функцію «Advanced Voice» для вибраних користувачів ChatGPT.

Джерело: OpenAI

Розширений голосовий режим ChatGPT забезпечує швидше та інтуїтивніше людське спілкування з ШІ. У рамках нової функції OpenAI оприлюднив п’ять нових голосів: Arbor, Maple, SXol, Spruce і Vale, які є доповненнями до існуючих варіантів голосу Breeze, Juniper, Cove і Ember. 

Журнал: Lady of Crypto «закінчиться з криптовалютою» до вересня 2025 року: X Hall of Flame