谷歌已向所有 Android 用户免费提供其语音 AI 聊天机器人功能 Gemini Live。该功能允许用户通过语音命令与谷歌的 AI 聊天机器人对话,此前仅向 Gemini Advanced 用户全面开放。

新功能使所有 Android 用户能够使用聊天机器人的对话功能,现在包括通过语音提问和在过程中打断回答。

上个月,谷歌在 Pixel 9 发布会上首次发布了 Gemini Live 应用程序。Android 用户现在可以通过按下 Gemini 应用程序中的波形图标直接启用该功能,从而开始使用语音与人工智能进行交互。此次发布正值 Open AI 的竞争功能 ChatGPT 高级语音模式尚未完全推出之时。

使用者现在可以透过更多控制存取 Gemini 的语音模式

Gemini Live 最显著的功能包括使用者能够大声提问、在句子中间打断答案以及为 AI 回应选择不同的声音。这种免持功能增加了一定程度的灵活性和个人化,使与人工智慧的对话更加流畅和反应灵敏。除了即时管理讨论之外,参与者还可以在需要时随时「保留」回应或「结束」对话。

尽管最初语音控制功能是付费服务的功能,但现在 Gemini 应用程式的免费版本中提供了这种语音功能。 Android 用户可以开始使用该应用程式或覆盖层以立即存取它。目前,语音模式仅针对英语进行了优化,不过,谷歌已确认计划添加更多语言,并在 iOS 设备上提供此功能,但没有给出确切的时间表。

OpenAI语音功能落后 谷歌推出Gemini Live

此次发布的时机让 Google 领先于 OpenAI,后者于 5 月推出了针对 ChatGPT 的高阶语音模式。然而,Open AI 提供的这项功能尚未广泛使用,自 7 月下旬以来一直有限。其他业内人士进一步表示,等待时间过长可能是因为支援基于语音的人工智慧互动需要很高的运算能力,尤其是大规模的互动。

谷歌免费推出 Gemini Live 的举动与 OpenAI 交错发布的类似功能形成鲜明对比。虽然 OpenAI 不断制定更广泛采用的策略,但 Google 的发布将 Gemini Live 交到了那些热衷于透过语音而不是打字与 AI 互动的用户手中,这成为两家公司之间的竞争优势。

目前,Gemini Live 可在 Android 设备上访问,谷歌计划在开发该服务时添加更多功能。