reddit dao

The Cryptonomist ha intervistato Anna Kazlauskas, CEO e co-fondatrice di Vana's, Reddit Data DAO, che nella prima settimana ha visto 140.000 utenti registrarsi con account Reddit verificati. Anna ora sta lavorando con gli sviluppatori per creare DAO di dati per altre piattaforme, come LinkedIn e ChatGPT. 

Oltre ai DAO, hanno altri punti vendita che consentono agli utenti di raggruppare i propri dati in set di dati che possono poi essere utilizzati per l'addestramento del modello GenAI, come la creazione di ritratti o avatar.

Al di là di ciò che sta facendo Vana, con Anna abbiamo parlato della crescita dello spazio dell'intelligenza artificiale decentralizzata, poiché le piattaforme aiutano le persone a utilizzare e monetizzare i propri dati per nuove applicazioni. 

Puoi fornire una panoramica di Vana e della sua missione nello spazio IA decentralizzato?

Vana è una piattaforma AI di proprietà degli utenti alimentata da dati di proprietà degli utenti. La nostra missione è che gli utenti possiedano i propri dati e il valore che creano attraverso i modelli di intelligenza artificiale. C’è una crescente necessità di più dati di addestramento per migliorare le prestazioni dei modelli di intelligenza artificiale, poiché in definitiva i modelli di intelligenza artificiale sono validi quanto lo sono i loro dati. 

Ad esempio, LLaMA 3 è addestrato su circa 15 trilioni di parole, che corrisponde all’incirca alla quantità di dati disponibili sull’Internet pubblica. Le aziende stanno ora cercando di acquisire più dati, a volte pagando centinaia di milioni di dollari per ottenerli. Le principali piattaforme tecnologiche stanno accumulando preziosi dati degli utenti e sviluppando nuove tecnologie senza considerare le autorizzazioni degli utenti, il che frena l’innovazione. 

Noi di Vana stiamo liberando i dati da questi giardini recintati mettendoli sotto il controllo degli utenti. Permettiamo agli utenti di contribuire direttamente ai modelli di intelligenza artificiale, scegliere come utilizzare i loro dati e come viene utilizzata l'intelligenza artificiale. Riteniamo di poter effettivamente sovraperformare i modelli principali se riusciamo ad accedere ai dati migliori, battendo le prestazioni di modelli come GPT-6 accedendo solo ai dati disponibili direttamente dagli utenti. Vana è concepita come una blockchain di livello 1 progettata da zero per dati privati ​​di proprietà degli utenti. 

Reddit Data DAO ha registrato 140.000 utenti registrati nella prima settimana. Cosa pensi abbia guidato questa rapida adozione e quali lezioni hai imparato da questo lancio?

Reddit Data DAO è stato un successo incredibile dal punto di vista dell'adozione, con oltre 140.000 utenti che si sono iscritti nella prima settimana. Questo livello di adozione è insolito per le DAO: ora è la più grande DAO di dati della storia. 

Uno degli aspetti che ne ha favorito una rapida adozione è che gran parte della storia era già stata spiegata, poiché gli utenti stanno diventando sempre più consapevoli del valore dei propri dati attraverso la copertura stampa delle vendite di dati. Rendersi conto che Reddit vende i tuoi dati per 200 milioni di dollari o che Apple li acquista per 50 milioni di dollari ti rende molto più consapevole del loro valore. 

C’è anche un forte interesse per i prodotti di proprietà degli utenti integrati nel web3 che vanno oltre i familiari prodotti DeFi verso una nuova frontiera della proprietà. Stiamo assistendo a questa tendenza in progetti come Farcaster, reti DePIN e DAO di dati basati su Vana, che rappresentano una nuova ondata di prodotti di proprietà degli utenti.

Una lezione importante è stata la necessità di provare i requisiti contributivi. Oltre un milione di persone hanno provato ad aderire a Reddit Data DAO, ma molti non soddisfacevano i criteri di avere un account Reddit attivo da un certo tempo e con una quantità minima di dati. Ciò evidenzia l’importanza di disporre di meccanismi per garantire contributi di qualità.

Hai menzionato i piani per creare DAO di dati per piattaforme come LinkedIn e Chat GPT. Quali sfide e opportunità uniche vedi nell’espansione su queste piattaforme?

Vana è una rete peer to peer per i dati di proprietà degli utenti e gli sviluppatori hanno creato vari DAO di dati come Reddit Data DAO, LinkedIn Data DAO e ChatGPT Data DAO. 

Queste diverse fonti di dati sono incredibilmente preziose per l’addestramento dei modelli di intelligenza artificiale, ma attualmente sono rinchiuse in giardini recintati. Può essere complicato estrarre dati da ciascuna di queste piattaforme, ma è sempre possibile grazie alla regolamentazione dei dati. 

In che modo Vana consente agli utenti di monetizzare i propri dati e quali sono alcuni esempi di come gli utenti ne hanno beneficiato?

Il nostro obiettivo è aiutare gli utenti a monetizzare e proteggere i propri dati contemporaneamente. Ad esempio, con Reddit Data DAO, stanno ora addestrando un modello di proprietà dell'utente (per lo più incentrato sullo merda in questa fase, ma è un inizio). Gli utenti vengono pagati ogni volta che il modello viene utilizzato, creando un incentivo economico per la proprietà congiunta del modello. 

E i dati degli utenti rimangono completamente privati: invece di vendere dati, i dati vengono semplicemente “affittati” dove i dati sottostanti non lasciano mai l’ambiente sicuro. 

Con la crescente preoccupazione per la privacy dei dati, in che modo Vana garantisce che i dati degli utenti siano sicuri e utilizzati eticamente all'interno dei Data DAO?

La privacy dei dati è passata dall’essere solo una questione ideologica o di preferenza a una questione economica. Se qualcuno ha i tuoi dati, può potenzialmente creare una versione AI di te che sia economicamente preziosa, guadagnando entrate e potenzialmente competendo con te. Ecco perché la privacy è così importante e fondamentale per Vana. 

Abbiamo inventato un concetto chiamato “dati non custoditi”, che è simile a un portafoglio non custodito ma per i tuoi dati personali. Mantiene i tuoi dati sotto il tuo pieno controllo, autorizzato dalla tua chiave privata. Ciò consente ai tuoi dati di essere portabili tra le applicazioni e aggiunge sopra un livello finanziario nativo, consentendo la creazione di cose come DAO di dati.

In che modo i set di dati creati tramite i Data DAO di Vana migliorano l’addestramento dei modelli di intelligenza artificiale generativa e quali vantaggi offrono rispetto ai set di dati tradizionali?

In genere, i modelli di intelligenza artificiale vengono addestrati con dati estratti dall’Internet pubblica, dati disponibili senza effettuare l’accesso da nessuna parte. Ma se ci pensi dalla prospettiva di insegnare a un bambino il mondo, non vorrai che vaghino a caso sull’Internet pubblica. Dovresti fornire loro informazioni di alta qualità che potrebbero non essere disponibili al pubblico, ad esempio scritti, processi mentali o messaggi di alta qualità. L’intelligenza artificiale si basa principalmente su dati pubblici, ma ha davvero bisogno di dati privati ​​per oltrepassare i confini. Questo è ciò che consentono i DAO dei dati: gli utenti contribuiscono con i propri dati privati ​​per creare un'intelligenza artificiale di proprietà dell'utente. 

Crediamo che l’intelligenza artificiale dovrebbe essere creata più come un software open source, da una comunità. Il nostro obiettivo è fornire ai ricercatori l’accesso ai migliori set di dati attualmente tenuti prigionieri all’interno di giardini recintati per ampliare le frontiere delle prestazioni dell’intelligenza artificiale.

Quali tendenze prevedi nello spazio dell’intelligenza artificiale decentralizzata nei prossimi 5-10 anni e come si posiziona Vana per guidare in questo panorama in evoluzione?

Lo spazio dell’intelligenza artificiale decentralizzata ha registrato una notevole accelerazione nell’ultimo anno. Ad esempio, quest’anno all’EthCC si è verificato un evento di intelligenza artificiale decentralizzata quasi ogni giorno, rispetto a nessuno l’anno scorso. Le persone stanno cercando di capire come applicare le tecnologie sovrane che hanno funzionato bene per la finanza allo spazio dell’intelligenza artificiale. Noi di Vana crediamo che il fondamento principale di tutto ciò siano i dati. Per creare un'IA di proprietà degli utenti e un'IA sovrana, sono necessari dati di proprietà degli utenti, quindi la nostra attenzione è concentrata su quel dato.

Nei prossimi 5-10 anni, sono entusiasta di alcuni traguardi raggiunti: 1) Un modello di fondazione di proprietà degli utenti posseduta collettivamente da 100 milioni di persone. 2) Agenti IA più autonomi che possono guadagnare da soli e garantire che tali agenti siano veramente di proprietà degli utenti che hanno contribuito alla loro formazione. 

Poiché l’intelligenza artificiale svolge un ruolo economico sempre più importante, garantendo che il potere sia ampiamente distribuito sia dal punto di vista tecnico che sociale. 

Puoi condividere ulteriori informazioni sulla tua collaborazione con gli sviluppatori per creare DAO di dati? Quali sono i progetti innovativi attualmente in cantiere?

Vana è una rete senza autorizzazione, quindi chiunque può creare un DAO di dati. È una blockchain di primo livello progettata da zero per dati privati ​​di proprietà degli utenti. Oggi ci sono oltre 100 DAO di dati distribuiti sul testnet Satori. Molti dei costruttori sono i primi partecipanti all'ecosistema Bittensor che comprendono profondamente l'intersezione tra criptovaluta e intelligenza artificiale. Alcuni progetti degni di nota includono Twitter Data DAO, LinkedIn Data DAO e GitHub Data DAO. Collaboriamo inoltre con progetti nello spazio ZK e nello spazio degli strumenti DAO per rendere i DAO dei dati ancora più facili da creare e gestire.

Quali considerazioni etiche sono più urgenti nello sviluppo dell’intelligenza artificiale decentralizzata e in che modo Vana affronta questi problemi?

Penso che una delle domande più grandi nell’intelligenza artificiale oggi sia chi dovrebbe possedere i modelli e decidere quali dati inserirvi. Man mano che iniziamo a fare sempre più affidamento sull’intelligenza artificiale per le informazioni, essa diventa la nostra fonte di verità. Chiunque decida cosa entra nell’intelligenza artificiale, essenzialmente decide la verità. È spaventoso avere un’unica entità che controlla tutto questo. Il nostro punto di vista in Vana è che sia la comunità, non una singola azienda, a prendere queste decisioni.

Un’altra domanda che si pone nell’IA decentralizzata è: se l’IA è completamente decentralizzata, allora cosa succede se diventa canaglia e non c’è un pulsante di spegnimento? Il modo in cui affrontiamo questo problema in Vana è che i modelli di intelligenza artificiale sono in ultima analisi di proprietà degli utenti che hanno contribuito ad essi, quindi mantengono sempre il pieno controllo. 

Che consiglio daresti agli aspiranti imprenditori che desiderano entrare nello spazio dell'intelligenza artificiale decentralizzata, in base alle tue esperienze con Vana e Data DAO?

È un ottimo momento per iniziare a costruire nello spazio dell’IA decentralizzata. Ci sono molte opportunità per applicare alcuni dei primitivi criptoeconomici che hanno funzionato bene per la DeFi alla nuova categoria emergente di dati decentralizzati e intelligenza artificiale. Consiglierei anche di dedicare un po’ di tempo ad immergersi nello spazio dell’intelligenza artificiale non crittografica e open source per conoscere alcuni degli approcci che le persone stanno adottando al di fuori del contesto crittografico. Mi immergerei in alcuni dei progetti esistenti per vedere con che tipo di primitive sono disponibili per la creazione, incluso il tentativo di avviare un DAO di dati su Vana.