O Google disponibilizou seu recurso de chatbot de IA com tecnologia de voz, Gemini Live, gratuitamente para todos os usuários do Android. O recurso, que permite que os usuários falem com o chatbot de IA do Google por meio de comandos de voz, estava disponível anteriormente totalmente para assinantes do Gemini Advanced.
O novo recurso permite que todos os usuários do Android utilizem as funções de diálogo do chatbot, que agora incluem fazer perguntas por voz e interromper as respostas no processo.
Este anúncio vem após o primeiro lançamento do aplicativo Gemini Live no mês passado no evento Pixel 9 do Google. Usuários do Android agora podem facilmente habilitar o recurso diretamente pressionando um ícone de forma de onda dentro do aplicativo Gemini, o que permite que eles comecem a usar interações de voz com a IA. O lançamento vem em um momento em que o recurso concorrente da Open AI, Advanced Voice Mode for ChatGPT, ainda não foi completamente lançado.
Os usuários agora podem acessar o modo de voz do Gemini com mais controle
A funcionalidade mais notável do Gemini Live inclui a capacidade dos usuários de fazer perguntas em voz alta, interromper respostas no meio de uma frase e escolher vozes diferentes para as respostas da IA. Esse recurso viva-voz adiciona algum grau de flexibilidade e personalização, tornando as conversas com a IA mais fluidas e responsivas. Além de gerenciar a discussão em tempo real, os participantes também podem "segurar" as respostas ou "encerrar" a conversa a qualquer momento, sempre que necessário.
Embora, a princípio, a capacidade de controle de voz fosse um recurso de um serviço pago, esse recurso de voz agora está disponível na versão gratuita do aplicativo Gemini. Usuários do Android podem começar a usar o aplicativo ou sobreposição para ter acesso a ele imediatamente. Atualmente, o modo de voz é otimizado apenas para oferecer suporte ao idioma inglês, no entanto, o Google confirmou planos para adicionar mais idiomas e disponibilizar esse recurso também em dispositivos iOS, embora nenhum cronograma exato tenha sido fornecido.
Google lança Gemini Live enquanto o recurso de voz do OpenAI fica para trás
O momento deste lançamento coloca o Google na frente do OpenAI, que tornou conhecido seu Advanced Voice Mode para ChatGPT em maio. No entanto, este recurso oferecido pelo Open AI ainda não foi amplamente disponibilizado, tendo ficado em disponibilidade limitada desde o final de julho. Outros insiders da indústria sugeriram ainda que o longo período de espera pode ser devido ao alto poder computacional necessário para suportar interações de IA baseadas em voz, especialmente em larga escala.
A iniciativa do Google de lançar o Gemini Live gratuitamente contrasta com o lançamento escalonado de um recurso semelhante da OpenAI. Enquanto a OpenAI continua desenvolvendo uma estratégia para uma adoção mais ampla, o lançamento do Google coloca o Gemini Live nas mãos dos usuários que estão interessados em interagir com a IA falando em vez de digitar, tornando isso uma vantagem competitiva entre as duas empresas.
Atualmente, o Gemini Live pode ser acessado em dispositivos Android e o Google planeja adicionar mais funcionalidades à medida que desenvolve o serviço.