Google ha puesto a disposición de todos los usuarios de Android de forma gratuita su función de chatbot con inteligencia artificial que funciona con la voz, Gemini Live. La función, que permite a los usuarios hablar con el chatbot con inteligencia artificial de Google mediante comandos de voz, anteriormente estaba completamente disponible para los suscriptores de Gemini Advanced.

La nueva función permite a todos los usuarios de Android utilizar las funciones de diálogo del chatbot, que ahora incluyen hacer preguntas por voz e interrumpir las respuestas en el proceso.

Este anuncio llega después del primer lanzamiento de la aplicación Gemini Live el mes pasado en el evento Pixel 9 de Google. Los usuarios de Android ahora pueden habilitar fácilmente la función directamente presionando un ícono en forma de onda dentro de la aplicación Gemini, lo que les permite comenzar a usar interacciones de voz con la IA. El lanzamiento llega en un momento en que la función competidora de Open AI, Advanced Voice Mode for ChatGPT, aún no se ha implementado por completo.

Los usuarios ahora pueden acceder al modo de voz de Gemini con más control

La funcionalidad más destacada de Gemini Live incluye la posibilidad de que los usuarios hagan preguntas en voz alta, interrumpan las respuestas en medio de una oración y elijan diferentes voces para las respuestas de la IA. Esta función de manos libres agrega cierto grado de flexibilidad y personalización, lo que hace que las conversaciones con la IA sean más fluidas y receptivas. Además de gestionar la discusión en tiempo real, los participantes también pueden "retener" las respuestas o "finalizar" la conversación en cualquier momento cuando lo necesiten.

Aunque en un principio la función de control por voz era una característica de un servicio de pago, esta función activada por voz ya está disponible en la versión gratuita de la aplicación Gemini. Los usuarios de Android pueden empezar a utilizar la aplicación o la superposición para tener acceso a ella de inmediato. Actualmente, el modo de voz está optimizado para admitir solo el idioma inglés, sin embargo, Google ha confirmado planes para agregar más idiomas y hacer que esta función esté disponible también en dispositivos iOS, aunque no se ha dado un cronograma exacto.

Google lanza Gemini Live mientras la función de voz de OpenAI se queda atrás

El momento de este lanzamiento coloca a Google por delante de OpenAI, que presentó su modo de voz avanzado para ChatGPT en mayo. Sin embargo, esta función ofrecida por Open AI aún no se ha puesto a disposición de todo el mundo, ya que ha estado disponible de forma limitada desde finales de julio. Otros expertos de la industria sugirieron además que el largo período de espera puede deberse a la alta potencia computacional necesaria para admitir interacciones de IA basadas en voz, especialmente a gran escala.

La decisión de Google de lanzar Gemini Live de forma gratuita contrasta con el lanzamiento escalonado de una función similar por parte de OpenAI. Mientras OpenAI sigue desarrollando una estrategia para una adopción más amplia, el lanzamiento de Google pone a Gemini Live en manos de los usuarios que desean interactuar con la IA hablando en lugar de escribiendo, lo que convierte a esta función en una ventaja competitiva entre las dos empresas.

Actualmente, Gemini Live está accesible en dispositivos Android y Google planea agregar más funcionalidades a medida que desarrolla el servicio.