作者:Paul Veradittakit ,Pantera Capital 合夥人
編譯:xiaozou,金色財經
Sahara AI 的使命是創造一個更加開放、公平和協同的人工智能經濟,讓人們儘可能容易地參與其中。利用區塊鏈,Sahara 確保所有貢獻者(數據貢獻者、labelers、模型開發人員等)得到公平的補償,數據和模型保持主權,人工智能資產具有安全性,權限可以創建、共享和交易。
1、AI 堆棧現狀
當前的 AI 堆棧可分爲以下幾層:
數據收集和標註
數據是從各種來源收集的(例如網絡抓取、公共數據集、用戶生成的數據),必須遵守許可要求以避免法律問題。數據根據手頭的任務進行標註(例如分類、對象識別)。
模型訓練及服務
數據被輸入到模型中,模型調整其內部參數(權重)以最小化誤差。這需要相當昂貴且耗時的計算。
AI 智能體的創建和部署
創建 AI 智能體的用戶體驗通常涉及使用 TensorFlow 等工具,需要有技術專長。
計算資源
模型訓練需要昂貴的處理。
每一層都競爭激烈且多樣化,在很大程度上,有一種執行方式被證明是最有效的。例如,數據收集最好使用大型公共數據集(如書籍),並使用專門數據(研究論文)進行微調。模型訓練最好在專門的硬件上完成,AI 智能體應該很容易使用即插即用的資源來建立一個開發者社區,計算資源應是分佈式的,以便精準獎勵計算資源提供者。這些結合在一起將帶來更好的 AI 模型和更強大的社區。
Web2 公司正朝着這個方向努力,但由於他們的設計師集中式的,所以面臨着嚴重的限制。從企業和技術的角度來看,這些公司旨在限制訪問並隔離堆棧的各個不同部分,從而導致不同的安全標準、數據庫設計、後端集成和貨幣化策略。實際上,這樣的設計很糟糕,是無法應對人工智能經濟模式的轉變的。
舉例來說,OpenAI 已經構建了一個非常強大的基礎模型,並開始通過其無需許可的 GPT wrapper 市場吸引社區 builders,但只允許表面的提示定製,不支持底層模型的重構。該公司所有的計算資源都是用投資者的錢購買的,預計今年年底將虧損 50 億美元。
2、AI 協同經濟
Sahara 平臺在整個人工智能生命週期中爲所有人工智能開發需求提供一站式服務:從數據收集和標註,到模型訓練和服務,AI 智能體的創建和部署,多智能體通信,人工智能資產交易,以及人工智能資源的衆包等。通過使人工智能開發過程民主化以及降低現有系統的進入壁壘,Sahara AI 爲個人、企業和社區提供了平等的訪問權限,共同建設人工智能的未來。
上圖概括了用戶旅程,描繪了在 Sahara AI 生態系統中,人工智能資產是如何從創建到使用再到實現用戶粘性的過程。值得注意的是,平臺內的所有交易都是不可變且可追蹤的,所有權受到保護,資產來源也被記錄下來。這支持透明和公平的收益分享模式,確保開發者和數據提供者都能因產生收益而獲得適當的補償。
Sahara 的目標是讓人們更加輕鬆地參與到人工智能經濟中來。開發者和用戶可以這樣使用 Sahara:
經驗豐富的 AI 開發人員:
開發人員可以使用 Sahara SDK 和 API 與 Sahara 區塊鏈及其 AI 堆棧的任意層進行交互,例如個性化算力、數據存儲和激勵結構,以形成他們自己的 Sahara AI 智能體,可被授權和貨幣化,以供其他人使用。
AI 開發新手:
通過無代碼 / 低代碼環境,開發人員可以通過直觀的界面和預構建模板創建和部署 AI 資產。
AI 訓練:
要參與人工智能模型訓練,用戶只需訪問一個網站,在那裏他們可以完成人工智能訓練任務然後獲得可交易代幣的補償,任務範圍從解決基本數學問題到短視頻描述。
AI 用戶:
用戶可以通過直觀的 UI 輕鬆使用 AI 智能體。用戶可以靈活購買訪問及進一步開發的許可權限,甚至可以交易 AI 資產 shares。
用戶將能夠創建自己的個性化數據「知識庫」,並使用用戶自己的數據創建專門的人工智能。就像其他人工智能一樣,這將允許他人訪問,而訓練數據仍然是完全私密安全的。
公司:
公司也可以創建 AI 智能體(或「商業代理」),訓練他們自己的專有數據,由於系統運行在 Sahara 區塊鏈上,得益於去中心化 AI 智能體生成和服務,成本要低得多。
企業也可以付費生成 Sahara 數據,它融合了 AI 自動標註和人工標註,有效地創建了高質量、保護隱私的多模型數據集。
除了面向企業的產品已經被一些知名客戶使用之外,其他所有功能都還沒有發佈,但都有了發佈計劃。
3、技術概況
Sahara 團隊將系統設計得儘可能簡單易用,抽象出了確保 AI 堆棧各部分的兼容性、盈利性和安全性所需的複雜性。在幕後,Sahara 團隊開發了無數創新來實現這一目標。舉幾個例子:
Sahara 區塊鏈最大限度地降低了 gas 費,完全兼容 EVM,Sahara 跨鏈通信(SCC)協議實現了跨區塊鏈的安全、無需許可的數據傳輸,促進了無需信任的互操作性。
Sahara AI-Native Precompiles(SAPs)是預編譯的智能合約,用於優化 AI 任務的性能,以減少計算開銷,包括訓練執行 SAPs 和推理執行 SAPs。
Sahara 區塊鏈協議(SBPs)管理人工智能資產以確保會計責任,如 AI Attribution 跟蹤貢獻和分配獎勵,AI Asset Registry 來管理 AI 資產、AI 許可和 AI 所有權的註冊和來源。
數據管理在鏈上和鏈下進行,AI 資產元數據、承諾和證明在鏈上,而重要的數據集、AI 模型和補充信息在鏈下進行,以優化數據檢索、安全性和數據可用性。
Collaborative Execution Protocols(協作執行協議)支持跨 AI 訓練、聚合和服務的聯合 AI 模型開發和部署。像 PEFT 這樣的其他模型允許技術微調,Privacy Preserving Compute(隱私保護計算)支持差分隱私、同態加密和祕密共享,Fraud Proofs(欺詐證明)的功能如其名所示。
4、完全集成的 AI 堆棧
該團隊由南加州大學終身教授 Sean Ren 和加州大學伯克利分校校友 Tyler Z 掌舵,前者曾被在(麻省理工科技評論)科技創新 35 人之列,並榮獲 2023 年度三星研究員,後者曾擔任 Binance Labs 的投資總監。團隊的其他成員具有斯坦福大學、加州大學伯克利分校、AI2、Toloka、Stability AI、微軟、幣安、谷歌、Chainlink、LinkedIn、Avalanche 等公司的背景或經驗,貢獻了寶貴的專業知識。
Sahara 還有頂級 AI 原生研究人員和企業客戶提供建議:
Laksh Vaaman Sehgal(Motherson Group 副主席)
Rohan Taori(人類研究科學家)
Teknium(Nous Research 聯合創始人)
Vipul Prakash(Together AI 首席執行官)
Elvis Zhang(Midjourney 創始成員)
Sahara AI 目前被超過 35 家領先的技術創新項目和研究機構使用,包括微軟、亞馬遜、麻省理工學院、Motherson 集團和 Snap,用於各種人工智能服務,如 Shara Data 用於數據收集 / 標註,Sahara Agents 用於個性化領域智能體。
生成式 AI 在技術和市場規模方面仍處於起步階段;由於難以將整個 AI 堆棧集成到一個產品中,因此今天的集中式聊天和視頻工具的覆蓋範圍有限。Sahara AI 是唯一一家通過模塊化設計解決這一瓶頸的公司,該設計使用區塊鏈作爲無需許可訪問、代幣分配和安全性的支柱。爲了讓所有人都能參與其中,人工智能的未來必須是易於訪問且公平的,而 Sahara AI 是唯一一家朝着這一願景前進的公司。