Vous êtes-vous déjà demandé pourquoi les médias sociaux comme Reddit, X (anciennement Twitter) sont gratuits ? La réponse est en fait cachée dans les publications que vous publiez chaque jour, dans les likes sur lesquels vous cliquez ou même dans le temps que vous passez.
Autrefois, ces plateformes vendaient votre attention comme une marchandise aux annonceurs. Aujourd’hui, ils ont trouvé un acheteur plus important : les sociétés d’IA. Selon les rapports, un seul accord de licence de données entre Reddit et Google peut rapporter aux anciens 60 millions de dollars de revenus annuels. Mais cette immense richesse n’a rien à voir avec vous et moi en tant que créateurs de données.
Ce qui est encore plus inquiétant, c’est que l’IA formée sur nos données pourrait même remplacer nos emplois à l’avenir. Même si l’IA peut également créer de nouvelles opportunités d’emploi, l’effet de concentration des richesses provoqué par ce monopole des données exacerbera sans aucun doute les inégalités sociales. Nous semblons glisser vers un monde cyberpunk contrôlé par une poignée de géants de la technologie.
Alors, en tant que gens ordinaires, comment pouvons-nous protéger nos intérêts à l’ère de l’IA ? Après l’essor de l’IA, de nombreuses personnes considèrent la blockchain comme la dernière ligne de défense de l’humanité contre l’IA. C’est sur la base de cette réflexion que certains innovateurs ont commencé à explorer des solutions. Ils ont proposé : premièrement, nous devons reprendre la propriété et le contrôle de nos propres données ; deuxièmement, nous devons utiliser ces données pour former conjointement un modèle d’IA qui sert réellement les gens ordinaires.
Cette idée peut paraître idéaliste, mais l’histoire nous dit que toute révolution technologique commence par une idée « folle ». Aujourd'hui, un nouveau projet de chaîne publique appelé « Vana » transforme cette idée en réalité. En tant que premier réseau décentralisé de liquidité des données, Vana tente de convertir vos données en jetons circulant librement et favorise ainsi la réalisation d'une intelligence artificielle décentralisée véritablement contrôlée par les utilisateurs.
Le fondateur de Vana et les origines du projet
En fait, la naissance de Vana remonte à une salle de classe du Media Lab du Massachusetts Institute of Technology (MIT). C'est là que se sont rencontrés deux jeunes ayant l'ambition de changer le monde – Anna Kazlauskas et Art Abal.
左:Art Abal;右:Anna Kazlauskas
Anna Kazlauskas s'est spécialisée en informatique et en économie au MIT, et son intérêt pour les données et les crypto-monnaies remonte à 2015. À cette époque, elle participait aux premiers travaux d’exploitation minière d’Ethereum, et cette expérience lui a fait prendre profondément conscience du potentiel de la technologie décentralisée. Par la suite, Anna a mené des recherches sur les données auprès d'institutions financières internationales telles que la Réserve fédérale, la Banque centrale européenne et la Banque mondiale. Ces expériences lui ont fait comprendre que dans le monde futur, les données deviendront une nouvelle forme de monnaie.
Pendant ce temps, Art Abal poursuivait une maîtrise en politiques publiques à l'Université Harvard et se penchait sur l'évaluation de l'impact des données au Belfer Center for Science and International Affairs. Avant de rejoindre Vana, Art a dirigé des méthodes innovantes de collecte de données chez Appen, fournisseur de données de formation en IA, qui ont joué un rôle déterminant dans la création de nombreux outils d'IA générative actuels. Ses connaissances en matière d’éthique des données et de responsabilité en matière d’IA ont insufflé à Vana un sens aigu de la responsabilité sociale.
Lorsqu'Anna et Art se sont rencontrés en cours au MIT Media Lab, ils ont rapidement découvert qu'ils partageaient une passion pour la démocratisation des données et les droits des utilisateurs en matière de données. Ils ont réalisé que pour véritablement résoudre les problèmes de propriété des données et d’équité de l’IA, un nouveau paradigme était nécessaire : un système permettant aux utilisateurs de véritablement contrôler leurs propres données.
C’est cette vision commune qui les a réunis pour fonder Vana. Leur objectif est de créer une plate-forme révolutionnaire qui vise non seulement la souveraineté des données pour les utilisateurs, mais garantit également que les utilisateurs peuvent bénéficier économiquement de leurs données. Grâce au mécanisme innovant DLP (Data Liquidity Pool) et au système de preuve de contribution, Vana permet aux utilisateurs de fournir des données privées en toute sécurité, de posséder et de bénéficier conjointement des modèles d'IA formés par ces données, favorisant ainsi le développement de l'IA dirigé par l'utilisateur.
La vision de Vana a été rapidement reconnue par l'industrie. À ce jour, Vana a annoncé avoir finalisé un financement total de 25 millions de dollars, dont un tour de table stratégique de 5 millions de dollars dirigé par Coinbase Ventures, un tour de série A de 18 millions de dollars dirigé par Paradigm et un tour de table de 2 millions de dollars dirigé par Polychain. de financement. Parmi les autres investisseurs notables figurent Casey Caruso, Packy McCormick, Manifold, GSR et d'autres.
Dans ce monde où les données sont le nouveau pétrole, l’émergence de Vana nous offre sans aucun doute une opportunité importante de retrouver la souveraineté des données. Alors, comment fonctionne exactement ce projet potentiellement prometteur ? Examinons de plus près l’architecture technique et les idées innovantes de Vana.
L’architecture technique et les idées innovantes de Vana
L’architecture technique de Vana est un écosystème soigneusement conçu pour démocratiser et maximiser la valeur des données. Ses composants principaux comprennent le pool de liquidité des données (DLP), le mécanisme de preuve de contribution, le consensus de Nagoya, les données auto-hébergées des utilisateurs et la couche d'application décentralisée. Ensemble, ces éléments construisent une plateforme innovante qui protège la confidentialité des utilisateurs tout en libérant la valeur potentielle des données.
1. Data Liquidity Pool (DLP) : la pierre angulaire de la valorisation des données
Le pool de liquidité de données est l'unité de base du réseau Vana et peut être compris comme la version de données du « minage de liquidités ». Chaque DLP est essentiellement un contrat intelligent conçu pour regrouper un type spécifique d'actifs de données. Par exemple, Reddit Data DAO (r/datadao) est un exemple de DLP réussi, attirant plus de 140 000 utilisateurs de Reddit. Il regroupe l'historique des publications, des commentaires et des votes Reddit d'un utilisateur.
Une fois que les utilisateurs ont soumis des données au DLP, ils peuvent obtenir des récompenses de jetons spécifiques au DLP. Par exemple, le jeton spécifique de Reddit Data DAO (r/datadao) est RDAT. Ces jetons représentent non seulement les contributions des utilisateurs au pool de données, mais donnent également aux utilisateurs des droits de gouvernance sur DLP et des droits sur la répartition future des revenus. Vana permet notamment à chaque DLP d'émettre ses propres jetons, ce qui fournit un mécanisme de capture de valeur plus flexible pour différents types d'actifs de données.
Dans l’écosystème de Vana, les 16 meilleurs DLP peuvent également recevoir des récompenses supplémentaires pour l’émission de jetons VANA, ce qui stimule davantage la formation et la concurrence de pools de données de haute qualité. De cette manière, Vana transforme habilement les données personnelles fragmentées en actifs numériques liquides, jetant ainsi les bases de la valorisation et de la liquidité des données.
2. Preuve de contribution : mesure précise de la valeur des données
La preuve de contribution est le mécanisme clé de Vana pour garantir la qualité des données. Chaque DLP peut personnaliser une fonction de certification de contribution unique en fonction de ses propres caractéristiques. Cette fonction vérifie non seulement l'authenticité et l'intégrité des données, mais évalue également la contribution des données à l'amélioration des performances du modèle d'IA.
En prenant le ChatGPT Data DAO comme exemple, sa preuve de contribution couvre quatre dimensions clés : l'authenticité, la propriété, la qualité et l'unicité. L'authenticité est garantie en vérifiant le lien d'exportation de données fourni par OpenAI ; la propriété est vérifiée par l'adresse e-mail de l'utilisateur ; l'évaluation de la qualité se fait en utilisant LLM pour évaluer l'unicité des conversations échantillonnées de manière aléatoire en calculant le vecteur de caractéristiques des données et en le comparant avec les données existantes ; J’ai raison d’en être sûr.
Cette évaluation multidimensionnelle garantit que seules les données précieuses et de haute qualité sont acceptées et récompensées. La preuve de contribution n’est pas seulement la base de la tarification des données, mais aussi une garantie clé pour maintenir la qualité des données de l’ensemble de l’écosystème.
3. Consensus de Nagoya : assurance qualité des données décentralisée
Le Consensus de Nagoya est le cœur du réseau Vana, qui s’appuie et améliore le Consensus Yuma de Bittensor. L'idée centrale de ce mécanisme est d'évaluer collectivement la qualité des données via un groupe de nœuds de vérification et d'utiliser une moyenne pondérée pour obtenir le score final.
Ce qui est encore plus innovant, c'est que le nœud de vérification évalue non seulement les données, mais note également le comportement de notation des autres nœuds de vérification. Ce mécanisme « d'évaluation à double couche » améliore considérablement l'équité et la précision du système. Par exemple, si un nœud validateur attribue un score élevé à une donnée manifestement de mauvaise qualité, d’autres nœuds pénaliseront ce comportement inapproprié.
Tous les 1 800 blocs (environ 3 heures) constituent un cycle, et le système attribuera les récompenses correspondantes aux nœuds de vérification en fonction du score global au cours de cette période. Ce mécanisme incite non seulement les nœuds de vérification à rester honnêtes, mais identifie et élimine également rapidement les mauvais comportements, maintenant ainsi le bon fonctionnement de l'ensemble du réseau.
4. Stockage de données non géré : la dernière ligne de défense pour la protection de la vie privée
L'une des innovations de Vana est son approche unique de la gestion des données. Dans le réseau Vana, les données originales de l'utilisateur ne sont jamais réellement « en chaîne ». Au lieu de cela, l'utilisateur choisit l'emplacement de stockage, tel que Google Drive, Dropbox ou même un serveur personnel fonctionnant sur un Macbook.
Lorsqu'un utilisateur soumet des données à DLP, il fournit en réalité simplement une URL vers les données cryptées et un hachage facultatif d'intégrité du contenu. Ces informations sont enregistrées dans le contrat d’enregistrement des données de Vana. Lorsque le vérificateur doit accéder aux données, il demande la clé de déchiffrement, puis télécharge et décrypte les données pour vérification.
Cette conception résout intelligemment les problèmes de confidentialité et de contrôle des données. Les utilisateurs conservent toujours un contrôle total sur leurs données tout en participant à l’économie des données. Cela garantit non seulement la sécurité des données, mais offre également la possibilité d'un plus large éventail de scénarios d'application des données à l'avenir.
5. Couche d'application décentralisée : réalisation diversifiée de la valeur des données
Au-dessus de Vana se trouve un écosystème d’applications ouvert. Ici, les développeurs peuvent utiliser la liquidité des données accumulées par DLP pour créer diverses applications innovantes, tandis que les contributeurs de données peuvent obtenir une valeur économique réelle de ces applications.
Par exemple, une équipe de développement peut former un modèle d'IA spécialisé basé sur les données du Reddit Data DAO. Les utilisateurs qui participent à la contribution des données peuvent non seulement les utiliser une fois la formation du modèle terminée, mais également obtenir les avantages générés par le modèle en fonction de leurs proportions de contribution respectives. En fait, un tel modèle d'IA a été développé. Pour plus de détails, veuillez lire « En fin de compte, pourquoi l'ancienne monnaie de l'IA r/datadao est-elle revenue à la vie ? 》.
Ce modèle encourage non seulement la contribution de données de meilleure qualité, mais crée également un écosystème de développement d'IA véritablement dirigé par les utilisateurs. Les utilisateurs passent de simples fournisseurs de données à copropriétaires et bénéficiaires de produits d’IA.
Vana remodèle ainsi l’économie des données. Dans ce nouveau paradigme, les utilisateurs passent du statut de fournisseurs de données passifs à celui de bâtisseurs d’écosystèmes qui participent activement et profitent les uns des autres. Cela crée non seulement de nouveaux canaux d’acquisition de valeur pour les individus, mais injecte également une nouvelle vitalité et un nouveau pouvoir d’innovation dans l’ensemble du secteur de l’IA.
L'architecture technique de Vana résout non seulement les problèmes fondamentaux de l'économie actuelle des données, tels que la propriété des données, la protection de la vie privée et la répartition de la valeur, mais ouvre également la voie à de futures innovations basées sur les données. À mesure que de plus en plus de DAO de données rejoignent le réseau et que de plus en plus d'applications sont construites sur la plate-forme, Vana a le potentiel de devenir l'infrastructure de la prochaine génération d'IA décentralisée et de l'économie des données.
Satori Testnet : le terrain d'essai public de Vana
Avec le lancement du testnet Satori le 11 juin, Vana a montré au public le prototype de son écosystème. Il ne s'agit pas seulement d'une plate-forme de vérification technique, mais également d'un aperçu du futur modèle opérationnel du réseau principal. Actuellement, l'écosystème Vana propose trois voies principales aux participants : exécuter un nœud de vérification DLP, créer un nouveau DLP ou soumettre des données à un DLP existant pour participer à « l'exploration de données ».
Exécutez le nœud de vérification DLP
Les nœuds de validation sont les gardiens du réseau Vana et sont chargés de vérifier la qualité des données soumises au DLP. L’exécution d’un nœud validateur nécessite non seulement des compétences techniques mais également des ressources informatiques suffisantes. Selon la documentation technique de Vana, la configuration matérielle minimale requise pour un nœud de validation est de 1 cœur de processeur, 8 Go de RAM et 10 Go de stockage SSD haute vitesse.
Les utilisateurs qui ont l'intention de devenir validateur doivent d'abord sélectionner un DLP, puis s'inscrire pour devenir validateur via le contrat intelligent du DLP. Une fois l'enregistrement approuvé, le validateur peut exécuter un nœud de validation spécifique à ce DLP. Il convient de noter que les validateurs peuvent exécuter simultanément des nœuds pour plusieurs DLP, mais chaque DLP a ses propres exigences de mise minimale.
Créer une nouvelle DLP
La création d'un nouveau DLP est une option intéressante pour ceux qui disposent de ressources de données uniques ou d'idées innovantes. La création de DLP nécessite une compréhension approfondie de l'architecture technique de Vana, en particulier de la preuve de contribution et du mécanisme de consensus de Nagoya.
Les créateurs de nouveaux DLP doivent concevoir des objectifs de contribution de données, des méthodes de vérification et des paramètres de récompense spécifiques. Dans le même temps, ils doivent également mettre en œuvre une fonction de preuve de contribution capable d’évaluer avec précision la valeur des données. Bien que ce processus soit complexe, Vana fournit des modèles détaillés et un support documentaire.
Participer à l'exploration de données
Pour la plupart des utilisateurs, soumettre des données au DLP existant pour participer au « data mining » peut être le moyen le plus direct de participer. Actuellement, 13 DLP ont été officiellement recommandés, couvrant plusieurs domaines allant des données des réseaux sociaux aux données de prévisions financières.
· Finquarium : regroupe les données de prévisions financières.
· GPT Data DAO : concentrez-vous sur l'exportation des données de chat ChatGPT.
· Reddit Data DAO : axé sur les données des utilisateurs de Reddit, il a été officiellement lancé.
· Volara : Focus sur la collecte et l'utilisation des données Twitter.
· Flirtuel : collectez des données de rencontres.
· ResumeDataDAO : Focus sur l'exportation de données LinkedIn.
· SixGPT : collectez et gérez les données de discussion LLM.
· YKYR : collecte des données Google Analytics.
· Sydintel : Révéler les recoins sombres d'Internet grâce à l'intelligence participative.
· MindDAO : collectez des données de séries chronologiques liées au bonheur des utilisateurs.
· Kleo : créez l'ensemble de données d'historique de navigation le plus complet au monde.
· DataPIG : concentrez-vous sur les données de préférence d'investissement symbolique.
· ScrollDAO : collecte et exploitation des données Instagram.
Certains de ces DLP sont encore en cours de développement et d’autres ont déjà été lancés, mais ils en sont tous au stade de pré-exploitation. Parce que ce n’est qu’après la mise en ligne du réseau principal que les utilisateurs peuvent officiellement soumettre des données pour l’exploitation minière. Cependant, il existe désormais des moyens permettant aux utilisateurs de verrouiller leur participation à l’avance. Par exemple, les utilisateurs peuvent participer à des activités de défi pertinentes dans l'application Vana Telegram ou se préinscrire sur le site officiel de chaque DLP.
Résumer
L’émergence de Vana marque un changement de paradigme dans l’économie des données. Dans la vague actuelle d’IA, les données sont devenues le « pétrole » de la nouvelle ère, et Vana tente de remodeler le modèle d’extraction, de raffinage et de distribution de cette ressource.
Essentiellement, Vana construit une version données de la solution de la « tragédie des biens communs ». Grâce à une conception intelligente des incitations et à l’innovation technologique, il transforme les données personnelles, une ressource qui semble être disponible en quantité illimitée mais difficile à monétiser, en un actif numérique qui peut être géré, tarifé et diffusé. Cela ouvre non seulement de nouvelles façons aux utilisateurs ordinaires de participer à la distribution des dividendes de l'IA, mais fournit également un modèle possible pour le développement de l'IA décentralisée.
Cependant, le succès de Vana reste confronté à de nombreuses incertitudes. Techniquement, elle doit trouver un équilibre entre ouverture et sécurité ; sur le plan économique, elle doit prouver que son modèle peut générer une valeur durable ; elle doit également faire face aux éventuels défis liés à l’éthique des données et à la réglementation.
À un niveau plus profond, Vana représente une réflexion et un défi pour le monopole des données et le modèle de développement de l’IA existants. Cela soulève une question importante : à l’ère de l’IA, devrions-nous choisir de continuer à renforcer l’oligarchie des données existante, ou essayer de construire un écosystème de données plus ouvert, plus équitable et plus diversifié ?
Que Vana réussisse ou non, son émergence nous offre une fenêtre pour repenser la valeur des données, l’éthique de l’IA et l’innovation technologique. À l’avenir, des projets comme Vana pourraient devenir un pont important entre les idéaux du Web3 et la réalité de l’IA, ouvrant la voie à la prochaine étape de l’économie numérique.