Project Astra 是這家科技巨頭對人工智慧未來的有趣展望,在今年的 Google I/O 開發者大會上推出。谷歌的宏偉目標是創造一個通用的、多模式的助手,可以輕鬆融入我們的日常生活並改變我們使用技術的方式,這個最先進的人工智慧系統體現了這一目標。

谷歌的多模式方法轉變

Project Astra 證明了 Google 致力於突破傳統以文字爲基礎的模型的人工智慧界限。透過結合先進的電腦視覺、自然語言處理和空間感知功能,Astra 開創了多模式人工智慧助理的新時代。這些系統可以透過各種方式感知和理解我們周圍的世界,包括語音、文字、圖像和視訊。

這種多模式方法是一種方法轉變,有望重新定義我們與人工智能助手的關係。Astra 不再僅僅依賴語音命令或文本輸入,而是能夠利用周圍環境中的上下文線索,以更自然、更直觀的方式理解和響應我們的查詢和指令。

Astra 隨時爲您服務

Project Astra 最引人注目的方面之一是它渴望成爲一個通用助手,無縫融入我們的日常生活。正如 Google DeepMind 負責人兼 Google 人工智能項目負責人 Demis Hassabis 所設想的那樣,Astra 將成爲一個“始終陪伴着你”的忠實夥伴,隨時準備協助完成各種任務和查詢。

想象一下,擁有一個數字助理,它不僅可以回答您的問題,還可以積極地與您的環境互動。需要幫助尋找您放錯地方的鑰匙或眼鏡嗎?Astra 可以使用其計算機視覺功能來定位它們。正在努力解決複雜的編碼問題?Astra 可以分析您的代碼,識別問題並提出改進建議。計劃旅行?Astra 可以根據您的偏好和從您的周圍環境收集的信息創建個性化行程。

Project Astra 真正與衆不同之處在於其實時操作能力,可提供即時響應和無縫交互。與可能出現嚴重延遲的傳統 AI 模型不同,Astra 經過精心設計,可提供閃電般的性能,確保流暢的對話式用戶體驗。

Demis Hassabis 承認,實現這種實時響應能力一直是 Google 團隊面臨的一項重大工程挑戰。然而,通過利用 Google 在優化基礎設施和擴展平臺方面的專業知識,他們成功克服了這一障礙,爲 Astra 無縫融入我們的日常生活鋪平了道路。

來自 Google 的協作和自適應伴侶

隨着 Astra 項目的不斷髮展,哈薩比斯設想未來這些人工智能代理將超越其單純的工具角色,成爲真正的合作者和夥伴。憑藉適應個人偏好和環境的能力,Astra 和類似系統可以根據每個用戶的獨特需求和願望定製其交互和功能。

想象一下個性化和適應性無縫融合,塑造人類與人工智能助手之間的關係,超越單純的實用性,實現深度參與和成就感。設想一個數字伴侶不僅能適應你的喜好,還能適應你進化的細微差別,無縫融入你生活的結構,成爲你人生旅途中不可或缺的盟友。

Astra 面臨的挑戰和機遇

雖然 Astra 項目代表着人工智能技術的重大飛躍,但我們必須承認未來仍存在挑戰和潛在陷阱。必須謹慎處理隱私和安全問題、道德考量以及如此強大的人工智能系統的社會影響。

谷歌和其他大型科技公司(如 OpenAI)都承認道德 AI 開發的重要性。爲了保證新技術的創造和應用能夠造福所有人,這些企業必須優先考慮開放性、責任感和道德標準。即使他們正在突破可行性的極限。

此外,Project Astra 和相關 AI 助手能否真正理解並滿足人類的需求和品味,對於其有效採用至關重要。儘管這項技術非常了不起,但這些助手能否成功,真正的考驗在於它們如何很好地融入我們的日常生活,以及它們整體上的表現如何。

Project Astra 體現了 Google 不斷致力於推動 AI 領域的發展。該公司制定了一項未來計劃,其中 AI 助手不僅僅是工具,而是真正的夥伴,能夠以簡單直觀的方式理解和與我們周圍的一切互動。這一願景是通過利用該公司在自然語言處理、計算機視覺和基礎設施優化方面的經驗來實現的。

我們正處於這場由人工智能推動的變革的開端,未來既有巨大的機遇,也有重大的挑戰。然而,只要負責任地進行開發、考慮道德問題,並始終專注於爲用戶創造價值,Project Astra 和類似計劃就有可能重塑我們與技術的關係,開啓人機協作的新時代,並以我們今天難以想象的方式改善我們的生活。

OpenAI 的生成模型怎麼樣?

Project Astra 的新概念類似於 OpenAI 的新 ChatGPT 界面,該界面允許快速語音對話和討論在電腦屏幕上看到的圖像或手機攝像頭拍攝的圖像。得益於名爲 GPT-4o 的新 AI 模型,當前版本的 ChatGPT 以更像人類的聲音和富有情感表現力的語調模仿驚訝和調情等情緒。

Project Astra 使用了 Gemini Ultra 的改進版本,該模型自 2023 年 3 月起開發,旨在與單一驅動的 ChatGPT 競爭。由於 Gemini 是“多模式的”,它可以無縫地創建和使用數據。它已經接受了所有格式的訓練。谷歌和 OpenAI 採用該方法標誌着生成式人工智能歷史上的新篇章。此前,人工智能的改進僅在基於文本的模型中產生,需要與其他平臺交互以添加視覺或音頻組件。這就是 ChatGPT 及其競爭對手的起點。

麻省理工學院研究機器人和人工智能的助理教授普爾基特·阿格拉沃爾 (Pulkit Agrawal) 表示,谷歌和 OpenAI 的最新演示非常精彩,展示了多模態 AI 模型的改進速度。2023 年 9 月,OpenAI 推出了可以解析照片的系統 GPT-4V 和可以解釋實時視頻的 Gemini。

即使開發與生成式人工智能兼容的硬件的嘗試迄今爲止失敗了,谷歌或許能夠利用 Astra 的功能讓其災難性的智能眼鏡起死回生。根據 Brenden Lake 的說法,加強像 Project Astra 這樣的系統和推進人工智能需要讓人工智能模型更好地理解現實世界。

《下一個前沿:Astra 項目和谷歌的人工智能未來》一文最先出現在 Metaverse Post 上。