自 2022 年底以來,人工智能 (AI) 一詞已成爲主流用語的一部分。然而,每當圍繞這項革命性技術的討論出現時,焦點似乎主要集中在其使用尖端算法和驅動這些系統的強大硬件等方面。

然而,一個同樣重要但經常被忽視的組成部分是支持這些人工智能模型的數據集。在過去的一年裏,越來越明顯的是,輸入這些複雜系統的信息的質量和數量對人工智能系統的成功至關重要。但誰來收集這些數據?我們如何確保這些數據的多樣性、準確性和合乎道德?

傳統上,AI 數據收集一直是專家和專業團隊的領域。這種方法雖然無疑會產生高質量的數據集,但往往會導致 AI 訓練過程中出現瓶頸,尤其是在引入個體偏見時。因此,這不僅僅是擁有足夠的數據;而是擁有代表廣泛觀點和用例的正確數據。

在此背景下,有關“去中心化 AI 基礎設施”的討論最近開始受到廣泛關注,特別是因爲它們爲實現 AI 數據收集民主化和加速該領域的創新提供了合法的解決方案。到目前爲止,現成的 AI 基礎設施提供商 NeurochainAI 利用了一個名爲“AI Mining”的社區驅動模塊,允許個人參與各種數據收集和驗證任務——有效地將其支持者變成了一個龐大而多樣化的數據收集網絡。

簡化複雜事物

從外部來看,分散式 AI 數據收集系統的優點在於,它們能夠將複雜的任務分解爲易於管理的、不需要專業知識的小部分。這種方法通常被稱爲“微工作”,幾乎任何受過基本培訓的人都可以爲 AI 開發做出貢獻。

NeurochainAI 的“數據啓動板”體現了這種方法,AI 開發人員或公司首先提交數據收集或驗證任務。然後,這些任務被細緻地分解爲任何人都可以遵循的指令。社區成員(稱爲“AI 礦工”)可以選擇他們感興趣的任務,並使用各自的 DePIN(去中心化物理基礎設施網絡)中的消費者硬件完成這些任務——即利用消費者硬件執行計算任務的本地化數字生態系統,從而將工作負載分配到設備網絡中。

收集到的數據隨後會由其他社區成員進行驗證,以確保準確性和質量。貢獻者會因其努力而獲得應有的回報,從而爲人工智能開發者和社區營造出互利互惠的局面。

此外,NeurochainAI 的模型解決了人工智能最緊迫的挑戰之一:巨大的能源消耗。傳統的人工智能數據中心消耗大量電力,據估計,到 2027 年,它們消耗的電力可能與整個荷蘭一樣多。

不僅如此,國際能源署的一項研究估計,到 2026 年,這些數據中心的用電量可能會增加到 620 至 1,050 TWh,分別相當於瑞典和德國的能源需求。NeurochainAI 的方法可以分散這種計算負載,從而有可能減少 AI 開發的整體能源足跡。

解鎖新領域

從目前的情況來看,人工智能數據收集民主化的影響似乎相當深遠和令人興奮。通過消除與“僅限專家的數據收集”實踐相關的一些瓶頸,我們有可能看到人工智能應用在歷史上因缺乏相關數據集而得不到充分服務的領域中出現爆炸式增長。

例如,我們可以想象人工智能模型能夠理解和生成罕見語言的高質量信息(這要歸功於世界各地母語人士收集的數據)。同樣,新的醫療人工智能用例也會出現,例如那些可以識別罕見疾病症狀的人工智能,這些人工智能是根據全球患者和醫護人員提供的數據進行訓練的。可能性真的是無窮無盡的!

最後但同樣重要的一點是,這種民主化的方法可以帶來更合乎道德和透明的人工智能開發。當數據收集成爲一項社區努力時,這個過程本身就會有更多的監督和多樣性。

因此,當我們展望人工智能驅動的未來時,像 NeurochainAI 這樣的平臺不僅改變了我們收集人工智能數據訓練信息的方式;它們還徹底重塑了這一領域的格局。