În era inteligenței artificiale, importanța datelor este de la sine înțeleasă. Datele servesc drept fundament pentru modelele AI mari, iar calitatea surselor de date de instruire determină capabilitățile AI și experiența utilizatorului produsului. Giganții tehnologiei Internet cu cantități mari de date de afaceri multidimensionale au avantaje de scenariu Prin anii de acumulare de date în timpul funcționării platformei de Internet și scenariile de utilizare existente ale platformei, pot fi generate o cantitate mare de date private. avantaje evidente în formarea și optimizarea modelului.
După lansarea primelor produse AI, aceștia se bazează pe feedback-ul de la propriile grupuri de utilizatori și pe interacțiunile cu produsele pentru a regla modelele, rezultând un efect de volan a datelor și optimizare și iterare continuă, care va deveni un șanț pentru produsele AI în viitor. Cu toate acestea, start-up-urile din domeniul AI suferă de cantitatea și calitatea insuficientă a surselor de date pentru a antrena modele. Acest tip de bariere de date și formarea de insule de date vor împiedica dezvoltarea inteligenței artificiale.
VANA: Spargerea insulelor de date, utilizatorii împărtășesc valoarea datelor
La început, internetul a fost plin de inovație, apărând diverse companii care au perturbat modelele de operare tradiționale ale industriei, dar ulterior, pe măsură ce industria s-a dezvoltat, companiile mari de tehnologie din internet au început să monopolizeze piața, iar platformele mari de internet au controlat intrările de trafic și au deținut o cantitate mare de date ale utilizatorilor. Platformele principale pot folosi aceste date ale utilizatorilor pentru a face recomandări algoritmice și împrumuturi pe bază de credit pentru a obține valoare comercială; Reddit a obținut 200 de milioane de dolari din vânzarea conținutului generat de utilizatori ca date de antrenament AI, dar utilizatorii care au generat datele nu au primit o parte din valoarea și rezultatele acestora. Apariția VANA va sparge insulele de date, permițând utilizatorilor să dețină datele și să împărtășească beneficiile generate de date.
VANA este un protocol deschis și descentralizat pentru suveranitatea datelor, funcționând ca un L1 compatibil cu EVM, VANA permite utilizatorilor să dețină propriile date și să contribuie cu datele personale pentru a împărtăși veniturile generate de inteligența artificială.
VANA rezolvă problema surselor de date pentru antrenarea modelelor AI
Este bine cunoscut că sursele de date pentru antrenarea modelelor AI ale companiilor de tehnologie din internet provin în principal din crawling, achiziții plătite și acumularea de date din activitatea proprie. Avantajul datelor obținute prin crawling este ușurința de accesare, dar calitatea datelor este scăzută, iar curățarea este dificilă; datele achiziționate plătit sunt grav uniformizate, din cauza competiției comerciale, sursele de date de afaceri cu adevărat valoroase sunt rare, iar aceste date sunt greu de oferit un avantaj diferențiat pentru modelele AI; datele acumulate din scenariile de afaceri au o valoare ridicată, dar această metodă nu este prietenoasă cu micile și medii întreprinderi.
Iar datele VANA provin din contribuțiile utilizatorilor din ecosistem, utilizatorii care participă în ecosistemul VANA contribuie cu date din rețelele sociale precum X, LinkedIn sau date din internetul lucrurilor, aceste date fiind stocate în siguranță offline. Datele sunt validate, curățate și etichetate înainte de a fi utilizate în dezvoltarea modelelor AI. Utilizatorii care participă și contribuie cu date pot obține drepturi de guvernare în DataDAO, decidând asupra dreptului de utilizare a datelor și împărtășind valoarea generată de date.
Avantajele modelului VANA
Adoptarea unei forme descentralizate de guvernare permite utilizatorilor să dețină proprietatea asupra datelor și să decidă modul în care sunt utilizate acestea;
Utilizatorii pot transforma datele în active tranzacționabile prin VANA, pentru aplicațiile de inteligență artificială descentralizată;
Prin utilizarea dovezilor fără cunoștințe (ZKP) și a mediilor de execuție de încredere (TEE) pentru a asigura confidențialitatea și securitatea datelor.
Structura rețelei VANA
Participanții VANA includ contribuabili de date, validatori, stakeri, consumatori de date și DLP (Creator de Piscină de Lichiditate pentru Date), adică DataDAO.
1. Contribuitorii de date
Utilizatorii participanți pot alege să contribuie cu datele lor la DataDAO înființate în rețeaua VANA; datele trimise sunt stocate offline, iar dovezile de contribuție sunt stocate pe lanț. De exemplu, utilizatorii din DataDAO ChatGPT solicită prin email OpenAI să exporte datele ChatGPT, iar după primirea răspunsului prin email, datele și linkul de descărcare sunt încărcate prin gptdatadao.org.
2. DataDAO
Stakingul a unui VANA de cel puțin 100 de dolari poate crea și înregistra un DataDAO; după completarea înregistrării, DataDAO va apărea pe DataHub pentru a fi selectat de contribuitorii de date. Pentru a stimula dezvoltarea continuă a DataDAO, VANA va oferi recompense pentru primele 16 DataDAO cu cele mai mari clasamente de staking; recompensele pentru primii trei ani sunt 15% din totalul tokenurilor, cu un ciclu de recompensă de 21 de zile, iar deblocarea stakingului necesită 7 zile. Numărul recompenselor VANA este determinat de cantitatea de staking, timpul de staking și numărul de recompense obținute de DataDAO. DataDAO trebuie să stakeze cel puțin 10.000 VANA pentru a avea șansa de a obține recompense. 50% din recompense sunt fix atribuite stakerilor, iar restul recompenselor sunt decise de DataDAO în legătură cu utilizarea lor.
În prezent, au fost înregistrate 17 DataDAO, inclusiv Volara, care se concentrează pe datele Twitter/X, R/DataDAO pentru Reddit și DLP Labs pentru datele de CV de pe LinkedIn, iar 140.000 de utilizatori Reddit s-au alăturat R/DataDAO, iar acum a fost antrenat primul model AI deținut de utilizatori.
3. Validatorii
Validatorii sunt responsabili pentru securitatea, integritatea și funcționalitatea blockchain-ului Vana Layer 1, asigurându-se că tranzacțiile de date sunt corect verificate, înregistrate și adăugate pe blockchain, incluzând în principal Validatorii L1 și Validatorii Satya.
Validatorii L1 sunt responsabili pentru securitatea și consensul VANA. Se poate deveni validator L1 cu un staking minim de 35.000 VANA; numărul inițial de validatori L1 este 64, iar ulterior se va extinde la 128. Fiecare bloc obține 5 VANA, iar penalizările pentru nefuncționare sunt de 10%; recompensele scad cu 10% anual.
Validatorii Satya oferă un mediu de execuție de încredere (TEE) pentru a verifica datele contribuției utilizatorilor și asigură securitatea și confidențialitatea procesului de validare. Astfel, obțin recompense VANA.
4. Consumatorii de date
Dezvoltatorii de modele AI ca consumatori de date aleg și achiziționează permisiuni de acces la seturi de date care se potrivesc cerințelor de dezvoltare a modelelor AI, utilizând infrastructura VANA pentru antrenare AI și analiză de date, colaborând cu DataDAO pentru a optimiza modelele AI.
De exemplu, în cazul DataDAO ChatGPT, utilizatorii încarcă linkuri de descărcare și fișiere de date care sunt transmise criptat validatorilor Satya. Validatorii Satya le decriptează și le verifică, asigurându-se de autenticitatea datelor încărcate de utilizatori, fără a fi fost modificate.
Scenariile de aplicare și modelul economic al tokenului VANA
1. Validatorii stakează VANA pentru a asigura securitatea rețelei și a verifica datele pentru a obține recompense VANA;
2. VANA ca gaz pentru executarea contractelor și interacțiunile DataDAO în rețea;
3. Utilizatorii stakează VANA în DataDAO pentru a obține recompense de staking VANA;
4. Consumatorii de date folosesc implicit VANA atunci când accesează datele;
5. Deținătorii de VANA participă la guvernare și votează propunerile; VANA este principalul instrument de tranzacționare pentru tokenurile emise de DataDAO.
Limita maximă a totalului VANA este de 120 de milioane de unități, iar distribuția tokenurilor este prezentată în figura de mai sus.
Comunitate
Include în principal recompensele pentru contribuțiile de date de înaltă calitate ale DataDAO, airdropurile pentru utilizatorii timpurii și dezvoltatorii. TGE va furniza 20,3% din VANA, fără perioadă de blocare.
Ecosistem
Include în principal tokenurile emise de DataDAO, recompensele de bloc și partenerii, TGE va furniza 4,8% din VANA, fără blocare.
Investitori
Vana a obținut până acum un total de 25 de milioane de dolari în finanțare, inclusiv 5 milioane de dolari în runda strategică de la Coinbase Ventures, 18 milioane de dolari în runda A de la Paradigm și 2 milioane de dolari în runda de seed de la Polychain.
Contribuitori principali
În concluzie, la TGE, volumul total de circulație al VANA este de 30 de milioane, inclusiv 4,8 milioane de VANA din Binance Launchpool.
Riscurile legale ale modelului VANA în cazul în care există în China
Proiectul de date al modelului AI descentralizat VANA rezolvă problema datelor pentru antrenarea modelului AI la un cost mai mic, permițând antreprenorilor de modele AI să aibă acces la date de antrenament de înaltă calitate, rupând insulele de date create de marii jucători din internet și făcând posibil scenariul în care Tencent obține datele utilizatorilor Alibaba pentru a antrena modele AI, reducând astfel barierele pentru persoanele și companiile dedicate antreprenoriatului în modele AI, dar acest model ar putea prezenta riscuri legate de ieșirea datelor în China.
Biroul Național de Informații pe Internet a publicat (Ghidul de aplicare pentru evaluarea securității ieșirii datelor (prima versiune)), care stipulează clar că comportamentele de ieșire a datelor includ:
(1) Procesatorul de date va transfera și stoca datele colectate și generate în cadrul operațiunilor din interiorul țării în străinătate;
(2) Datele colectate și generate de procesator vor fi stocate în interiorul țării; instituțiile, organizațiile sau persoanele din străinătate pot consulta, accesa, descărca sau exporta aceste date;
(3) Alte comportamente de ieșire a datelor stipulate de Biroul Național de Informații pe Internet.
(Legea Republicii Populare Chineze privind gestionarea intrării și ieșirii) Articolul 89 stipulează clar că ieșirea se referă la călătoria din interiorul Chinei către alte țări sau regiuni, din interiorul Chinei către Regiunea Administrativă Specială Hong Kong, Regiunea Administrativă Specială Macao sau din China continentală către Taiwan. Prin urmare, se poate deduce că evaluarea ieșirii se bazează pe jurisdicția judiciară.
Crearea DataDAO și contribuirea utilizatorilor cu date nu are restricții; consumatorii de date nu trebuie să facă KYC, fiind suficient să plătească VANA pentru a accesa datele colectate. În această situație, utilizatorii din țară care participă în diverse DataDAO contribuind cu date din rețele sociale sau CV-uri ar putea implica ieșirea de date.
Definiția informațiilor personale: conform articolului 76 din (Legea Republicii Populare Chineze privind securitatea cibernetică): informațiile personale sunt informații care pot identifica o persoană fizică, înregistrate prin metode electronice sau altele, inclusiv, dar fără a se limita la numele persoanei, data nașterii, numărul de identificare, informațiile biometrice personale, adresa, numărul de telefon etc.
Informațiile personale, inclusiv numele, data nașterii, numărul de telefon și alte informații sensibile, sunt implicate în datele de CV și datele de sănătate colectate de DataDAO. (Legea Republicii Populare Chineze privind protecția informațiilor personale) impune restricții la utilizarea acestor informații și la transferurile internaționale.