Відповідь Google OpenAI: анонсовано проект Astra

Шість років тому Google показала демо-версію штучного інтелекту під назвою Duplex на заході для розробників введення/виведення та домовилася про зустріч із перукарем. Після багатьох років компанія Google нещодавно анонсувала проект Astra. У спільній демонстрації Project Astra може бачити все навколо через камеру телефону та відповідати на ваші запитання щодо цього.

Генеральний директор Google DeepMind Деміс Хассабіс сказав у своїй сьогоднішній доповіді, що його команда працює над розробкою універсальних агентів ШІ, які можуть допомогти в повсякденному житті. Проект «Астра» є кроком до цієї мети.

У спільній демонстрації ми бачимо, що людина, яка тримає телефон, бере камеру пристрою та Project Astra в деякі частини офісу та ставить запитання. У наведеному прикладі користувач каже вголос: «Скажи мені, коли ти побачиш, що щось видає звук», а ШІ на основі Gemini відповідає: «Я бачу, що динамік видає звук». Потім користувач запитує ШІ, на що він вказує на динамік, і каже: «Це твітер. Він видає високочастотні звуки». отримує відповідь.

Згідно зі своєю заявою, Google підкреслює, що це відео було знято одним кадром і в реальному часі. Далі у відео показано, як Близнюки ідентифікують і пояснюють фрагменти коду на моніторі, повідомляючи користувачеві, в якому районі вони знаходяться, на основі виду з вікна.

Найбільше вражає, коли користувач запитує: «Ти пам’ятаєш, де я бачив свої окуляри?» Це відбувається, коли ви задаєте запитання. На відео у штучного інтелекту нічого не питали про окуляри, власне, в сцені, яку користувач показував на камеру телефону в цей момент, окулярів не було. Але незважаючи на це, Близнюк каже: «Так, я пам’ятаю. Ваші окуляри стоять поруч із червоним яблуком».