Google надав доступ до своєї функції голосового чат-бота Gemini Live безкоштовно для всіх користувачів Android. Функція, яка дозволяє користувачам спілкуватися з Google AI Chatbot за допомогою голосових команд, раніше була повністю доступна для передплатників Gemini Advanced.

Нова функція дозволяє всім користувачам Android використовувати діалогові функції чат-бота, які тепер включають голосові постановки запитань і переривання відповідей у ​​процесі.

Це оголошення з’явилося після першого запуску програми Gemini Live минулого місяця на заході Google Pixel 9. Користувачі Android тепер можуть легко ввімкнути цю функцію, натиснувши піктограму хвилі в програмі Gemini, що дозволяє їм почати використовувати голосову взаємодію зі ШІ. Розгортання відбувається в той час, коли конкуруюча функція Open AI Advanced Voice Mode для ChatGPT ще не повністю розгорнута.

Тепер користувачі можуть отримати доступ до голосового режиму Gemini з більшим контролем

Найпомітніша функція Gemini Live включає в себе можливість задавати запитання вголос, переривати відповіді в середині речення та вибирати різні голоси для відповідей ШІ. Ця функція гучного зв’язку додає певну гнучкість і персоналізацію, роблячи розмови за допомогою штучного інтелекту більш плавними та чуйними. Крім керування обговоренням у режимі реального часу, учасники також можуть «затримати» відповіді або «завершити» розмову в будь-який час, коли це буде потрібно.

Хоча спочатку можливість голосового керування була платною послугою, ця функція голосового керування тепер доступна у безкоштовній версії програми Gemini. Користувачі Android можуть почати використовувати програму або оверлей, щоб отримати до них доступ одразу. Наразі голосовий режим оптимізовано лише для підтримки англійської мови, однак Google підтвердив плани додати більше мов і зробити цю функцію доступною також на пристроях iOS, хоча точні терміни не вказані.

Google запускає Gemini Live, оскільки голосова функція OpenAI відстає

Час цього запуску ставить Google перед OpenAI, яка оголосила про свій розширений голосовий режим для ChatGPT у травні. Однак ця функція, запропонована Open AI, ще не стала широко доступною, оскільки вона була обмежена з кінця липня. Інші інсайдери галузі також припустили, що тривалий період очікування може бути пов’язаний з високою обчислювальною потужністю, необхідною для підтримки голосової взаємодії ШІ, особливо у великих масштабах.

Рішення Google безкоштовно запустити Gemini Live контрастує з поступовим випуском подібної функції OpenAI. У той час як OpenAI продовжує розробляти стратегію для більш широкого впровадження, випуск Google дає Gemini Live в руки користувачів, які хочуть взаємодіяти з ШІ, розмовляючи, а не вводячи, що робить це конкурентною перевагою між двома компаніями.

Наразі Gemini Live доступний на пристроях Android, і Google планує додати більше функцій у міру розробки сервісу.