11 月 27 日,趙長鵬在 X 上發文稱,AI 數據標註等任務非常適合通過區塊鏈完成,可藉助全球低成本勞動力,並通過加密貨幣即時支付,打破地域限制。
數據標記是指對原始數據(如文本、圖像、音頻等)進行人工或自動化的標註,使其具有特定的結構化信息。標記的數據用於訓練機器學習或人工智能模型,例如爲文本標註情感類別(正面、負面、中立)就是一種數據標記。而將區塊鏈用於人工智能數據標註,特別適用於需要高透明度、可信性和分佈式協作的數據標註場景。這不僅可以提升數據標註的效率和質量,還爲全球協作和數據交易創造了新的可能性。
目前,這一賽道有哪些優質的項目?賽道發展前景如何?
區塊鏈在 AI 數據標記中的作用
區塊鏈是一種去中心化的分佈式賬本技術,具有透明性、不可篡改性和可追溯性等特點。這些特點在數據標記中可以解決傳統方法中的以下問題:
數據真實性和防篡改: 每次標記的記錄都被寫入區塊鏈,無法被隨意更改,保證了標註的可信度。
任務分配透明性: 區塊鏈可以記錄任務的分發、執行和審覈過程,防止任務分配不公平或結果篡改。
激勵機制: 使用區塊鏈的智能合約技術,數據標註員可以通過完成任務自動獲得加密貨幣或其他獎勵。
數據溯源: 每個標記的來源、標註員以及審覈者的信息都可以被追蹤。
應用場景
分佈式標註: 利用區塊鏈,將數據標註任務分配給全球的標註員,數據處理效率更高。
質量審覈: 多人標註結果通過區塊鏈技術進行對比與審覈,確保標註準確性。
標註數據交易: 標註好的數據可以在區塊鏈上交易,買賣雙方無需擔心數據的完整性或真實性。
隱私保護: 使用區塊鏈對標註數據進行加密存儲,保證隱私數據安全。
相關項目
OORT DataHub:提供基於區塊鏈的去中心化數據標註服務,採用 Proof of Honesty 算法進行質量控制。其平臺通過智能合約分發任務、審覈數據質量和支付報酬,吸引全球標註者加入,並確保標註數據的透明性和隱私保護。
項目代幣的經濟模型如下:
社區獎勵:通過參與數據標註和分析,用戶可獲得 $OORT 代幣獎勵。此外,還可能獲得與貢獻掛鉤的獨特 NFT,這些 NFT 提供額外權益,如提高年收益率 (APY) 的獎勵、設備折扣和 DAO 投票權。
任務抵押:參與者需抵押至少 210 個 $OORT 代幣,以表明對任務的承諾,完成任務後會返還代幣併發放獎勵。
銷售收益分成:部分 NFT 持有者還可從未來的數據銷售收入中分紅,進一步提升長期收益。
PublicAI:Solana 鏈上 AI 生態項目,旨在連接數據需求方和全球標註者,通過加密代幣激勵機制獎勵參與者,同時利用區塊鏈技術記錄標註過程的細節,保障數據安全和隱私。
項目代幣的經濟模型如下:
社區獎勵:10% 的 Public 代幣將用於用戶前期交互的空投獎勵,具體來說獲取空投的方法有三種,成爲 AI Builder:收集高質量互聯網內容;成爲 AI Validator:驗證收集的內容;成爲 AI Developer:使用已驗證數據集訓練 AI 代理。
代幣分配:項目在 2024 年 1 月完成了 200 萬美元的種子輪融資,投資方包括 IOBC Capital、Foresight Ventures、Solana Foundation、Everstate Capital 及多位人工智能學界知名院士教授等,目前具體的 PublicAI 代幣分配細節尚未明確。
面臨的挑戰
目前,幾大因素束縛該賽道的發展:一是 AI 數據標記需要較高的計算和存儲資源;二是項目性能受制於區塊鏈的擴展性;三是技術標準化和監管尚不完善。
其中,第二點是或許是目前所面臨的最大的挑戰。因爲 AI 數據標記和模型訓練通常需要大量的計算資源,而區塊鏈網絡中的節點計算能力有限。如何在保證區塊鏈去中心化特性的前提下,有效地整合和利用分佈式計算資源來滿足 AI 數據標記項目的計算需求,是一個亟待解決的問題。據悉,幣安旗下的 Greenfield 正在爲這一賽道提供存儲支持,期待能有更多的存儲和計算資源在這一領域進行實踐。