谷歌的 Gemini AI 因其功能而发布的演示视频遭到了强烈反对。

科技公司和人工智能(AI)先驱谷歌 在过去几天发布了一段演示视频,详细介绍了其新的多模式人工智能模型 Gemini 的功能,因此受到了很多批评。

谷歌推出 Gemini AI

在 6 月份举行的 I/O 开发者大会上向公众透露了可能推出大型语言模型 (LLM) 后,这家科技巨头终于 在本周早些时候推出了Gemini AI。谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在X应用程序上分享了一段视频,宣传人工智能模型的潜力,重点强调其交互能力。

在这段看起来像是人类和人工智能语音助手之间的互动的视频中,双子座准确地识别了一只使用线条和形状创建的鸭子。该视频表明,Gemini AI 可以识别视觉图片和物理物体,甚至可以区分它们。 

这一独特的功能展示了人工智能设计和建模的新前沿。Gemini AI 强调了 LLM 的更综合使用,这可能会提升出色的用户体验,使其成为OpenAI 的 ChatGPT 的激烈竞争。此外,谷歌似乎试图告诉公众,有了 Gemini,他们可以与人工智能进行流畅的语音对话。

不幸的是,这段六分钟的视频引发了公众的一些负面反应,他们认为内容被篡改了。值得注意的是,该公司在 YouTube 上添加了一条描述,指出“为了本演示的目的,延迟已经减少,为了简洁起见,Gemini 输出也已缩短。” 

不过,在X应用程序上分享演示视频时,并未提及免责声明。

谷歌承认演示视频被编辑

谷歌向彭博社公开承认演示不是实时进行的。 

然而,该公司表示,“该视频基于真实的多模式提示和测试输出,说明了与 Gemini 交互的可能性。”

为了实现六分钟的演示,人工智能开发背后的谷歌团队使用了静态图像并提供了 Gemini 响应的文本提示。这与谷歌引导观众相信的概念不同。

尽管遭到强烈反对,但谷歌表示,它仍然期待“在 12 月 13 日开放 Gemini Pro 时看到人们创造的东西”。#Gemini  #谷歌AI