撰文:Ebunker

Grass 的定位與使用場景

Grass 是部署在 Solana 鏈上,結合 AI、Depin 和 Solana 技術的項目,定位爲 AI 的數據層。它是一個去中心化的網絡抓取平臺,旨在幫助公司和非營利組織通過利用未使用的互聯網帶寬來訓練人工智能(AI)。它通過瀏覽器擴展應用實現網絡抓取,利用個人的未使用互聯網帶寬,並以 Grass Points 獎勵用戶‌,Grass 通過讓用戶分享未使用的互聯網帶寬資源,旨在重新定義互聯網激勵結構,讓用戶直接從網絡中受益,並確保互聯網的價值掌握在用戶手中。目前,該網絡有 200 多萬個用戶運行節點,爲 AI 模型抓取了大量數據‌。

技術架構

Grass 主權數據 Rollup 是 Grass 在 Solana 上專門構建的網絡,它使協議能夠處理從數據源到處理、驗證和構建數據集的所有事務。該網絡圍繞驗證器 Validator(發出數據收集指令)、路由器 Router(管理 Web 請求分發)以及 Grass 節點 Node(用戶用來貢獻其閒置的網絡資源)構建。具體架構如下:

驗證器 Validator:接收、驗證和按批處理路由器的 Web 交易。然後,生成 ZK 證明以檢查鏈上的會話數據。鏈上證明可以在數據集中引用,以驗證數據來源並在整個生命週期內跟蹤其譜系。驗證器集將從最初的單一驗證器的中心化框架過渡到去中心化的驗證器委員會。

路由器 Router:將 Grass 節點連接到驗證器。路由器使節點網絡保持可追溯性,並中繼帶寬。Grass 按通過中繼提供的總驗證帶寬比例激勵其運行。 Router 負責向網絡中的驗證器報告以下指標:每個傳入和傳出請求的大小(以字節爲單位);每個節點的延遲和驗證器的延遲;每個連接節點的網絡狀態。

Grass 節點 Node:利用用戶未使用的帶寬和中繼流量,以便網絡可以抓取公共 Web 數據(而非用戶的個人數據)。運行節點是免費的,運行節點的人(節點操作員)按通過其中繼的數據而獲得報酬。

Zk 處理器 ZK Processor:批量處理所有 Web 請求的會話數據的有效性證明,並將證明提交到 L1 區塊鏈。此操作會永久記錄網絡上執行的每一次抓取行爲。這也爲全面瞭解 AI 訓練數據的來源奠定了基礎。

Grass 數據賬本 Grass Data Ledger:這是被抓取的數據和 L1 結算層之間的紐帶。賬本是一種不可變的數據結構,它託管完整的數據集並將數據鏈接到其相應的鏈上證明,是確保數據來源的數據存儲庫。

邊緣嵌入模型 Edge Embedding Models:這是將非結構化 Web 數據轉換爲結構化模型的過程。這包括所有必要的預處理步驟,確保收集的原始數據經過清理、規範化和結構化,格式符合 AI 模型的要求。

技術特性

在上述的架構中,Grass 網絡處於客戶端和 Web 服務器之間,客戶端發出 Web 請求,這些請求通過驗證器發送,最終通過 Grass 節點路由。無論客戶端請求哪個網站,其服務器都會響應 Web 請求,允許其數據被抓取併發送回線路。然後,它將被清理、處理並準備用於訓練下一代 AI 模型。

這個過程需要了解兩個主要的附加功能:Grass 數據分類賬和 ZK 處理器。

Grass 數據賬本是所有數據最終存儲的地方,它是 Grass 抓取的每個數據集的永久賬本,嵌入了元數據,從起源時刻記錄其最開始的譜系。每個數據集的元數據證明將存儲在 Solana 的結算層上,結算數據本身也通過賬本提供。

ZK 處理器的目的是幫助記錄 Grass 網絡上抓取的數據集的來源。過程如下:當網絡上的節點(即安裝了 Grass 擴展的用戶)向給定網站發送 Web 請求時,它會返回一個加密響應,其中包括節點請求的所有數據。這就是數據集誕生的時刻,即需要記錄的起源時刻,同時也是記錄元數據的時刻。它包含許多字段,如會話密鑰、抓取的網站 URL、目標網站 IP 地址、交易時間戳,當然還有數據本身。得益於這些必要的信息和網站來源清晰的數據集,AI 模型可以得到正確且忠實的訓練。

ZK 處理器可以使需要在鏈上結算的數據不被 Solana 驗證器看到。此外,未來將在 Grass 上執行的大量 Web 請求將超出 L1 能承受的吞吐量。Grass 很快就會擴展到每分鐘執行數千萬個 Web 請求的水平,並且每個請求的元數據都需要在鏈上結算。如果沒有 ZK 處理器先進行證明和按批處理,就不可能將這些交易提交給 L1。因此,Rollup 是實現計劃目標的唯一可能方法。

除了記錄數據集的來源網站之外,元數據還指示它通過網絡上的哪個節點路由。這意味着每當一個節點抓取網絡時,都可以因其作出的貢獻而獲得獎勵,而無需透露任何自己的身份信息。這使得 Grass 可以按比例獎勵節點,抓取數據更多、更有價值的節點將獲得更多的激勵,這一機制將顯著提高全球最熱門地區的獎勵,最終鼓勵這些地區的人註冊並增加網絡容量。加入的網絡規模越大,Grass 可抓取的容量就越大,存儲的網絡數據存儲庫就越大。數據越多則意味着 Grass 可以爲需要訓練數據的人工智能實驗室提供更多數據,從而激勵網絡繼續增長。

Grass 節點運行以及安全機制

Grass 節點運行是免費的,充當網絡通向互聯網的網關。節點運營商(即應用程序用戶)會因通過其節點中繼的流量而獲得獎勵,並根據其聲譽得分和地理需求獲得網絡流量。

Grass 節點有兩個主要用途:傳遞由客戶端發起並由驗證器指示的流量(即 Web 請求);將加密的 Web 服務器響應返回到指定的路由器。

節點支持的系統如上圖所示,運行節點的流程也很簡單:創建帳戶、下載 Grass 桌面應用程序、連接到網絡即可。

連接後,節點會自動在網絡上註冊。運營商負責維護網絡正常運行時間,以便節點可以將網絡請求轉發到公共網絡服務器。發送到 Grass 節點的每個請求都是一個加密的數據包。數據包僅向每個數據包目的地上的節點提供方向。網絡請求通過所有相關方的數字簽名進行身份驗證。這些簽名將驗證請求的合法性,確定是否應將其轉發到目標網絡服務器(即公共網站)。此加密流程可防止數據篡改,並確保驗證器可以準確測量每個節點的聲譽。

節點聲譽評分主要包括以下幾點:

  • 完整性:評估數據是否完整,評估數據集是否包含預期用例所需的所有必要數據點。

  • 一致性:檢查不同數據集或同一數據集內隨時間變化的數據一致性。

  • 及時性:衡量數據在需要時是否是最新的。

  • 可用性:評估每個節點的數據可用程度。

在安全機制方面,Grass 網絡不使用用戶節點(即計算機)或查看用戶在計算機上執行的任何操作。它所做的只是通過用戶的 IP 地址路由互聯網流量,與用戶的活動完全無關。這意味着 Grass 對用戶的個人數據的訪問爲零,被抓取的數據 100% 來源於公共網絡數據。

此外,Grass 使用帶寬加密來確保所有用戶在共享互聯網連接時都受到保護。Grass 還與領先的網絡安全合規審計公司 AppEsteem 合作,AppEsteem 24 小時監控 Grass 的產品是否存在漏洞、泄漏、後門和惡意軟件,以確保用戶的安全性。AppEsteem 認證在網絡安全行業享有很高的聲譽,獲得該認證意味着 Grass 的產品也被頂級反惡意軟件應用程序列入白名單,包括 Avast、Microsoft Defender、McAfee、AVG 等。

Grass token 的功能

Grass token 的持有者可以通過以下幾種方式參與 Grass 網絡:

  • 交易和回購:去中心化後,Grass 將用於支持網絡抓取交易、數據集購買和 LCR(實時上下文檢索)使用。

  • 質押和獎勵:將 Grass 質押到路由器以促進網絡流量,並因對網絡安全做出貢獻而獲得獎勵。

  • 網絡治理:參與 Grass 網絡的發展,包括提議和投票支持網絡改進、協調與哪些組織合作以及確定所有利益相關者的激勵機制。

據 Dune 網站統計,目前,Grass 的質押年化收益率在 45% 左右,約有 33% 的 grass token 參與了質押,質押數量超過了 2600 萬。

Router 質押與收益

路由器(Router)充當分散的樞紐,連接所有網絡節點並管理驗證器的 Web 請求的傳入和傳出。Router 運行受到激勵,獎勵與委託給每個路由器的質押量成比例。通過 Router 中繼路由的所有流量都經過加密和計量,以確保安全性和性能。

目前,各個 Router 的質押量如上圖所示,用戶可以將 Grass 質押到 Router 代表獲得收益,每個 Router 的佣金不同。

目前 DBunker 的 Grass 質押量約爲 143 萬,最小質押週期爲 7 天,佣金爲 10%。(數據來源https://www.grassfoundation.io/stake/delegations)用戶只需要點擊 STAKE 即可連接錢包,質押 Grass,獲取 Router 質押收益。

小結

Grass 致力於構建一個公正、開放的去中心化數據層,旨在解決當前互聯網數據提取的倫理問題及數據質量問題,反對由少數大公司控制的數據壟斷現象。在技術架構和特性方面,Grass 通過構建數據 Rollup,引入了記錄所有數據集來源的元數據機制。這些數據的 ZK 證明被存儲在 L1 結算層上,而元數據本身最終將與其底層數據集綁定,因爲這些數據集本身存儲在 Grass 的數據分類賬上。因此,ZK 證明爲提高透明度和爲節點提供商提供與其執行的工作量成比例的獎勵奠定了基礎,這也是激勵 Grass 網絡擴張的重要因素。

Grass 專注於加密貨幣與 AI 交叉領域的數據,與閉源、集中式 AI 的傳統參與者不同,它是 AI 數據的原始去中心化來源。作爲 web3 浪潮中的重要參與者,Grass 通過去中心化技術,爲 AI 公司和協議構建一個公正、開放的數據層,以市場需求爲切入點,發展前景可期。