原文作者 | @cebillhsu

編譯 | Golem

GPT-4、Gemini 1.5 和微軟 AI PC 等 AI 技術的進步令人印象深刻,但目前 AI 的發展也還面臨着一些問題,AppWorks 的Web3研究員 Bill 深入研究了其中的問題,並且探討了 Crypto 如何爲 AI 賦能的 7 個方向。

數據代幣化

傳統的 AI 訓練主要依賴於互聯網上可用的公開數據,或者更準確地說,是公共領域的流量數據。除了少數公司提供開放的 API 外,大多數數據仍未被開發。如何在確保隱私被保護的前提下,使更多數據持有者能夠貢獻或授權他們的數據用於 AI 訓練是一個關鍵方向。

然而,這一領域面臨的最大挑戰是數據很難像計算能力一樣標準化。雖然分佈式的計算能力可以通過 GPU 類型來量化,但私有數據的數量、質量和使用情況卻難以衡量。如果分佈式的計算能力像 ERC 20 ,那麼數據集的代幣化則類似於 ERC 721 ,這使得流動性和市場的形成比 ERC 20 更具挑戰性。

Ocean Protocol的 Compute-to-Data 功能允許數據所有者在保護隱私的同時出售私人數據。 vana爲 Reddit 用戶提供了一種聚合數據並將其出售給訓練 AI 大模型的公司的方法。

資源分配

目前,GPU 算力供需缺口很大,大公司壟斷了大部分 GPU 資源,這使得小公司訓練模型的成本非常高。很多團隊都在努力通過去中心化網絡集中小規模、使用率的 GPU 資源來降低成本,但他們在保證算力穩定和帶寬充足方面仍面臨較大挑戰。

激勵性 RLHF

RLHF(基於人類反饋的強化學習)對於改進大型模型至關重要,但這需要專業人員進行訓練。隨着市場競爭的加劇,僱用這些專業人員的成本也在增加。爲了在保持高質量標註的同時降低成本,可以使用質押和罰沒系統。數據標註的最大開支之一是需要監督員檢查質量。然而,多年來,區塊鏈已經成功地利用經濟激勵機制來確保工作質量(PoW、PoS),相信創建一個良好的代幣經濟系統可以有效降低 RLHF 的成本。

例如, Sapien AI已引入 Tag 2 Earn 並與多家 gamefi 公會合作;Hivemapper 通過代幣激勵機制,已有 200 萬公里道路的訓練數據; QuillAudits 計劃推出開源智能合約審計代理,允許所有審計人員共同訓練代理並獲得獎勵。

可驗證性

如何驗證算力提供商是否按照特定需求或模型執行推理任務?用戶無法驗證 AI 模型及其輸出的真實性和準確性。這種可驗證性的缺乏可能會導致金融、醫療和法律等領域的不信任、錯誤甚至利益損害。

通過使用諸如 ZKP、OP 和 TEE 等加密驗證系統,推理服務提供商可以證明輸出是通過特定模型執行的。使用加密驗證的好處包括模型提供商可以維護模型的機密性、用戶能夠驗證模型執行是否正確、以及將證明加密彙總到智能合約中可以規避區塊鏈的計算能力的限制。同時還可以考慮直接在設備端運行 AI 來解決性能問題,但是到目前爲止還沒有看到令人滿意的答案,在這一領域進行建設的項目有Ritual、ORA、Aizel Network。

深度僞造

隨着生產式 AI 的出現,人們越來越重視深度僞造(DeepFake)問題。然而,深度僞造技術的進步速度快於檢測技術,因此檢測深度僞造變得越來越困難。雖然數字水印技術(如 C 2 PA)可以幫助識別深度僞造,但它們也有侷限性,因爲加工過的圖像已經被修改,公衆無法驗證原始圖像上的簽名,只通過加工後的圖像,驗證將變得非常困難。

區塊鏈技術可以通過多種方式解決深度僞造問題。硬件認證可以使用防篡改芯片相機在每張原始照片中嵌入加密證明,以驗證圖像的真實性。區塊鏈具有不可篡改性,允許將帶有元數據的圖像添加到帶有時間戳的區塊中,防止篡改並驗證原始來源。此外,可以使用錢包將加密簽名附在發佈的帖子上,以驗證發佈內容的作者身份,基於 zk 技術的 KYC 基礎設施可以將錢包與經過驗證的身份綁定,同時保護用戶隱私。從經濟激勵的角度來講,作者應爲發佈了虛假信息而受到懲罰,用戶則可以通過識別了虛假信息而獲得獎勵。

Numbers Protocol多年來一直在這個領域深耕;Fox News 的驗證工具以 Polygon 區塊鏈爲基礎,允許用戶從區塊鏈中查找文章並檢索相關數據。

隱私

當 AI 模型輸入涉及金融、醫療保健和法律等領域的敏感信息時,在使用的同時保護數據隱私也極爲重要。同態加密 (FHE) 可以在不解密的情況下對數據進行處理,從而在使用 LLM 模型時保護隱私,工作流程如下:

  1. 用戶在本地設備上開始推理過程,並在完成初始層後停止。該初始層不包含在與服務器共享的模型中;

  2. 客戶端對中間操作進行加密,並將其轉發給服務器;

  3. 服務器對此加密數據進行部分注意力機制(attention mechanism)處理,並將結果發送回客戶端;

  4. 客戶端解密結果並在本地繼續推理。 通過這種方式,FHE 確保在整個處理過程中的用戶數據隱私得到保護。

Zama正在構建全同態加密 (FHE)解決方案,並且近期已經完成了 7300 萬美元融資來支持開發。

AI 代理

AI 代理的想法很具未來感,如果 AI 代理能夠擁有資產並進行交易那麼未來會是怎樣?人們可能會從使用通用的大型模型輔助決策轉向將任務分配給專門的代理。

這些代理將相互協作,就像合理的經濟關係可以提高人類的協作能力一樣,爲 AI 代理增加經濟關係也可以提高他們的效率。 區塊鏈可以成爲這一概念的試驗場地。例如, Colony正在通過遊戲試驗這一想法,爲 AI 代理提供錢包,以便與其他代理或真實玩家進行交易以實現特定目標。

結語

大多數問題實際上與開源 AI 有關。爲了確保未來十年如此重要技術不會被少數公司壟斷,代幣經濟系統可以快速利用去中心化的計算資源和訓練數據集,縮小開源和閉源 AI 之間的資源差距。區塊鏈可以跟蹤 AI 訓練和推理,以實現更好的數據治理,而加密技術可以確保後 AI 時代的信任,應對深度僞造和隱私保護問題。

相關閱讀

一文盤點 AI 賦能 Crypto 落地方向與協議