又一個豪華VC陣容Coinbase、Paradigm、Polychain三大Buff加持的AI+Crypto項目誕生了——Vana。 簡單而言,Vana目標將用戶私有數據實現Tokenization,搭建一個對用戶數據所有權和控制權以及未來經濟收益權的分配與激勵網絡,可以解決AI大模型在訓練過程中的數據不足的問題。
AI發展主要圍繞“算力”、“算法”“數據”三座大山,其中算力方向有io、Aethir,算法方向有 Bittensor、SaharaAI,Vana鎖定的正是被視爲AI燃料的“數據”方向。
有了龐大“數據源”的支持,AI可以進行多模態學習、持續學習、自監督學習等以增強AI大模型的應用場景和使用範圍。
現階段AI大模型訓練存在隱私、數據來源不均衡等諸多挑戰。泛文本類的網絡數據又嚴重過剩,而特定領域(醫療、法律)高質量的數據、(新聞、科技)等實時更新類等數據源又嚴重稀缺。如何才能打破傳統行業數據孤島,降低數據標記成本,有效解決隱私等複雜問題呢?
初步看了下Vana的技術文檔,其嘗試構建:
1)數據流動性網絡(Data Liquidity layer),可以像在DeFi體系靈活使用Token一樣,在Vana網絡使用數據;
2)數據可移植層(Data Portability layer),相當於構建了一個生態系統,是數據提供者、開發者、平臺能夠協作增進數據的有序流通,讓開發者可以通過工具接口直接利用數據,也會記錄並激勵高質量的數據貢獻等等;
3)數據“神經網絡系統”(Connectome),構建了一個可記錄生態實時數據交易的分佈式賬本,以及一套POS共識機制,確保DLP流動性層能正常運轉,還可與外部EVM環境兼容。這是Vana主網上線能夠有效解決AI數據問題的核心,是“數據”轉化爲可估量價值和可追溯流動性的關鍵基礎設施。