TechCrunchによると、Googleは、リアルタイムのマルチモーダル理解のためのAIアプリケーションとエージェントを開発する取り組みであるProject Astraの技術を少なくとも来年までリリースしないという。GoogleのCEOであるサンダー・ピチャイ氏は、火曜日の同社の第3四半期の収益報告でこのタイムラインを明らかにした。同氏は、GoogleはAIが世界を認識し推論できる体験の創出に取り組んでおり、Project Astraはその未来のプレビューであると述べた。同社は、2025年までにそのような体験を開始することを目指している。
2024年5月に開催されたGoogleのI/O開発者会議で発表されたProject Astraには、さまざまな技術が含まれています。その範囲は、周囲の状況を認識して関連する質問に答えるスマートフォンアプリから、ユーザーに代わってタスクを実行できるAIアシスタントまで多岐にわたります。I/Oでの録画済みデモで、Googleは、スマートフォンのカメラの視野内にある物体に関する質問に答えることができるProject Astraのプロトタイプを実演しました。たとえば、近所の特定や壊れた自転車の部品の名前などです。
今月初め、The Information は、Google が早ければ 12 月にも消費者中心のエージェント エクスペリエンスを導入し、製品の購入や航空券の予約などのタスクを処理できるようにする予定であると報じました。しかし、このエクスペリエンスが Project Astra とは別のものでない限り、これは実現しそうにありません。一方、Anthropic は、PC 上のアプリや Web ブラウザーを制御できる大規模な生成 AI モデルを開発した最初の企業の 1 つになりましたが、多くの基本的なタスクでまだ課題に直面しています。