Auteur : Teng Yan, Chain of Thought ; Traduction : 金色财经xiaozou
1. Ruée vers l'or des données
Pendant la ruée vers l'or de Californie au milieu du XIXe siècle, des milliers de personnes poursuivaient l'espoir de richesses dans de nouvelles frontières.
Les pauvres se retrouvent soudainement enrichis, et les histoires de réussite de ceux qui commencent à partir de rien deviennent courantes, entraînant l'émergence de davantage d'industries et de villes. L'infrastructure se développe à une vitesse incroyable, redéfinissant le visage de l'Amérique.
Les similitudes entre Crypto AI et la ruée vers l'or sont indéniables.
Aujourd'hui, la plupart des produits Crypto AI sont encore en phase de développement, soit fonctionnant sur des réseaux de test, ce qui indique que nous sommes en phase de construction d'infrastructure.
Les investisseurs et les bâtisseurs se préparent à un potentiel afflux de croissance. Les outils, réseaux et protocoles actuellement en cours de création pourraient constituer la base d'un vaste écosystème d'intelligence artificielle décentralisée.
Nous assistons à une phase précoce d'une ruée numérique sur les données - cette ruée pourrait être aussi transformative que celle du XIXe siècle.
Il est donc facile d'imaginer à quel point j'ai été surpris de tomber sur un projet Crypto AI revendiquant plus de 700 000 utilisateurs actifs quotidiens. Pas des utilisateurs actifs mensuels, mais quotidiens. Dans un domaine aussi émergent, de tels indicateurs d'utilisateurs sont inédits. J'ai donc dû faire des recherches approfondies pour comprendre ce qui se passe réellement en coulisses.
Quel est ce projet ? DIN, soit "Data Intelligence Network".
2. Réseaux de données crypto
J'ai suivi de près les réseaux de données dans le domaine de Crypto AI, et il est clair qu'ils s'attaquent à un point douloureux clé dans le domaine de l'IA : l'accès aux ensembles de données de valeur.
Aujourd'hui, de nombreuses sources de données les plus précieuses sont strictement contrôlées par des entités centralisées qui facturent des frais d'accès élevés.
Par exemple :
Reddit a signé un accord de licence de 60 millions de dollars par an avec OpenAI, fournissant un accès à son contenu généré par les utilisateurs.
X (anciennement Twitter) ne propose plus d'accès gratuit à l'API pour les développeurs, et les frais d'accès aux données Twitter varient entre 100 dollars et 42 000 dollars par mois (ce n'est pas une blague).
Le message transmis est clair : les entreprises reconnaissent que les données sont le nouveau champ de bataille, et elles verrouillent le contrôle pour maximiser les profits.
Crypto offre une solution potentielle - une façon de se libérer du contrôle centralisé des ensembles de données de valeur.
Les réseaux de données crypto adoptent une approche complètement différente, visant à construire des ensembles de données décentralisées de haute qualité, sans les goulets d'étranglement des modèles traditionnels. Grâce à l'utilisation de tokens, ces réseaux peuvent inciter des travaux d'annotation de données à grande échelle, incitant les individus à contribuer à la collecte de données à grande échelle, voire à organiser le scraping de données d'entraînement.
La blockchain, quant à elle, apporte de la transparence, créant un cadre pour suivre la propriété et l'origine des données. Cela garantit que chaque fois que les données d'un contributeur sont utilisées, il reçoit une compensation équitable, établissant un nouveau paradigme où la valeur des données est partagée, plutôt que monopolistique.
3. Vision de DIN
DIN est une équipe qui aborde de front les problèmes de données.
Au cœur de DIN se trouve une couche de données qui collecte et vérifie des données en chaîne et hors chaîne, utilisant la blockchain comme couche de règlement.
Quelle est l'idée principale ? C'est de restituer la propriété des données aux utilisateurs, afin qu'ils soient récompensés pour leurs contributions au système.
Fonctionnement de DIN :
Ce graphique peut sembler complexe au premier abord, décomposons-le.
Le réseau DIN a trois principaux acteurs :
Collecteurs de données
Validateurs de données
Nœuds de calcul
Pour mieux comprendre comment fonctionnent les collecteurs et validateurs de données, examinons de plus près xData, qui est actuellement le produit phare de DIN.
(1) xData : collecte de données
xData est la plateforme phare de DIN, principalement utilisée pour collecter, organiser et stocker des données de plates-formes de médias sociaux comme X, sans avoir besoin de dépendre d'API. Elle fonctionne sur un réseau décentralisé, garantissant la propriété et la confidentialité des utilisateurs. Elle a été lancée en avril 2024 sur opBNB (un L2 de la chaîne BNB).
xData rend la collecte de données des utilisateurs ludique et lucrative grâce à des mécanismes de gamification. Voyons rapidement comment cela fonctionne :
Les utilisateurs installent un plugin de navigateur, se connectent avec leur portefeuille et l'associent à leurs comptes X.
Les utilisateurs peuvent taguer des tweets intéressants en répondant aux tweets et en taguant des comptes.
Les utilisateurs peuvent obtenir des points "wafers" en taguant des tweets, ces points pouvant être échangés contre des tokens lors de la TGE.
Il existe plusieurs mécanismes de gamification ici. Chaque utilisateur peut stocker un nombre limité de tweets tagués, mais ils peuvent augmenter leur espace de stockage en consommant des points wafers. Les utilisateurs doivent également consommer des wafers toutes les 24 heures pour maintenir leur compte en "état débloqué" afin de gagner plus de wafers.
DIN publie des tâches autour de mots-clés ou d'étiquettes spécifiques, les membres de la communauté recherchent en temps réel des tweets et les taguent selon les étiquettes spécifiques.
La nature sans autorisation de xData signifie que n'importe quel utilisateur dans le monde peut participer à la collecte et à l'annotation de données pour des récompenses/revenus, sans aucune restriction de nationalité. Actuellement, la collecte de données se fait hors chaîne, les tweets tagués étant stockés sur BNB green field, une couche de données décentralisée sur la chaîne BNB.
(2) Nœuds Chipper : validation des données
La question suivante est naturellement : comment garantir la qualité et l'intégrité des données soumises par les utilisateurs ? Après tout, quelqu'un pourrait faire fonctionner un robot d'intelligence artificielle pour maximiser les bénéfices, taguant aléatoirement des tweets qui ne correspondent pas aux étiquettes spécifiées.
L'annotation des données n'est pas toujours simple. Les tweets contiennent souvent des surnoms, des expressions argotiques et des facteurs culturels - par exemple, le Bitcoin est souvent appelé "grand gâteau" dans les tweets en chinois.
C'est là que la validation des données entre en jeu.
Les nœuds Chipper sont des nœuds de validation et de traitement de données pilotés par l'intelligence artificielle de DIN, responsables de la vérification et de la vectorisation des données, tout en permettant aux utilisateurs de gagner des tokens (xDIN et DIN).
En coulisses, chaque nœud opéré par un utilisateur exécute en réalité un petit modèle d'IA local pour vérifier si le contenu des tweets correspond aux étiquettes ajoutées, puis l'enregistre dans une couche de données décentralisée. Les utilisateurs peuvent opérer ces nœuds sur un PC standard sans nécessiter un matériel coûteux.
À mesure que le nombre de données vérifiées traitées augmente, les modèles d'intelligence artificielle utilisés par les validateurs s'améliorent continuellement, rendant le réseau plus intelligent et plus précis au fil du temps.
Actuellement, DIN peut traiter en interne toutes les vérifications de données, mais l'objectif est de décentraliser le processus de vérification. Les nœuds sont actuellement en phase de test actif. Les utilisateurs peuvent exécuter un logiciel de nœud sur leurs appareils locaux pour tester le réseau, et DIN est prêt à lancer son mainnet et ses tokens dans les prochaines semaines, avec des récompenses pour les bugs en place.
(3) Nœuds de calcul
Bien que les nœuds de calcul ne soient pas encore en service, ils font partie du plan de confidentialité de DIN pour un stockage sécurisé des données à l'avenir. Voici comment fonctionnent les nœuds de calcul :
Transformation vectorielle : les nœuds de calcul convertissent les données vérifiées en vecteurs.
Traitement de la confidentialité : les vecteurs sont traités par des processeurs ZK (zero knowledge), garantissant la confidentialité.
Détermination finale des données : les ensembles de données et vecteurs finalisés sont stockés dans IPFS pour un accès tiers.
Un nouveau L2 sur la chaîne BNB ?
Aucune annonce officielle n'a encore été faite, mais dans notre recherche, nous avons trouvé un token DIN sur le réseau de test de la chaîne BNB. Cela suggère un développement futur de la blockchain - peut-être une side chain ou une solution L2 sur la chaîne BNB.
Présentation de DIN :
DIN donne l'impression d'être un nouveau joueur, mais l'origine du projet remonte à la fin de 2021. Il a été initialement lancé sous le nom de "Web3Go", comme une plateforme d'analyse de données en chaîne dans l'écosystème Polkadot, financée par la Web3 Foundation et collaborant avec des clients comme Moonbeam et Oak Network.
En 2022, l'équipe a élargi son champ d'action à l'écosystème de la chaîne BNB, rejoignant l'incubateur MVB des laboratoires Binance, et a obtenu le financement nécessaire pour développer une "plateforme d'analyse de données multi-chaînes open-source".
D'ici juillet 2023, ils ont vu des signes : l'intelligence artificielle générative était en plein essor, et la demande pour une infrastructure de données robuste était plus pressante que jamais. L'équipe s'est donc tournée vers la construction d'une "couche d'intelligence des données IA" complète, alignant leur mission sur la demande en données générée par l'innovation en intelligence artificielle. Cette évolution culminera en mai 2024, lorsque Web3Go sera officiellement renommé DIN, marquant une attention audacieuse sur les données et préfigurant que la couche de données deviendra essentielle pour le prochain progrès de l'IA.
4. Traction de DIN - un bon élan jusqu'à présent
Le nombre d'utilisateurs quotidiens sur opBNB est d'environ 700 000.
Le volume des transactions quotidien sur DIN sur opBNB est d'environ 1,2 million.
Selon DappBay, DIN a maintenu une performance stable en octobre, avec un nombre moyen d'utilisateurs quotidiens dépassant 700 000 et un volume de transactions quotidien supérieur à 1,2 million. La plupart des transactions sont dues au fait que les utilisateurs de xData doivent effectuer une transaction en chaîne toutes les 24 heures pour activer leur application xData et accumuler des points.
DIN a été l'un des 10 meilleurs dApps sur la chaîne BNB et, à de nombreuses occasions, il a été l'application numéro un en termes d'utilisateurs. Bien que je ne surveille pas aussi attentivement l'écosystème de la chaîne BNB que celui de Solana et Base, ce n'est pas un petit exploit, surtout compte tenu de l'historique de lancement de la chaîne BNB et du fort soutien de Binance.
Pour mieux comprendre, j'ai analysé quelques autres applications de premier plan sur la chaîne BNB pour voir ce qui façonne l'engagement des utilisateurs :
Vooi (DeFi) est un agrégateur DEX perpétuel.
Le réseau Particle (infrastructure) est un protocole de chaîne complète dans le réseau de test.
Revox (infrastructure) est un réseau modulaire en chaîne, possédant une application de contenu populaire - ReadON.
SERAPH (jeu) est un RPG similaire à Souls.
MyShell est un écosystème de boutique d'applications AI sans code.
Selon l'équipe, jusqu'à présent, DIN a collecté et annoté plus de 100 millions de tweets, avec une base d'utilisateurs de plus de 30 millions sur opBNB et Mantle.
Il convient de noter que DIN peut tirer parti de sa vaste base d'utilisateurs pour générer rapidement des ensembles de données en temps réel sur des tweets pertinents. Ce processus ne dépend complètement pas de l'API X.
Bien que le cœur de xData soit actuellement Twitter, l'équipe prévoit d'étendre la plateforme de collecte et d'annotation de données à d'autres sources de données comme Reddit, Facebook, Instagram, ainsi que toute plateforme de données utilisateur contenant des informations de grande valeur. Pour moi, c'est là que se trouve le véritable or.
Reiki :
Reiki est un autre produit de DIN, qui est étroitement lié aux agents d'IA meta en cours. En fait, compte tenu de l'intérêt potentiel des consommateurs pour les agents d'IA que nous avons vu ces dernières semaines sur Truth Terminal et GOAT, DIN pourrait déjà être en avance sur son temps.
En janvier 2024, DIN a lancé la plateforme Reiki, permettant aux utilisateurs de créer des agents d'IA (principalement des chatbots) sans expérience en codage. Les utilisateurs peuvent également intégrer leurs propres bases de connaissances pour créer des chatbots engageants et personnalisés, rappelant MyShell.
La plateforme a rapidement attiré l'attention dès son lancement, devenant le produit numéro un sur Product Hunt.
Reiki offre également aux créateurs plusieurs moyens de monétiser leurs robots, de participer à des programmes de récompenses, et même de transformer leurs robots en NFT - ajoutant une couche amusante d'expérience de jeu - la propriété. Il est à noter que le robot de support de connaissance Discord de la chaîne BNB est alimenté par Reiki.
Bien que la plateforme soit actuellement largement abandonnée, l'équipe DIN n'exclut pas la possibilité de la réactiver après le lancement de leur token. Si elle est réactivée, Reiki pourrait fournir une utilité supplémentaire aux tokens et offrir aux créateurs d'agents d'IA un moyen d'exploiter les données collectées par xData.
5. Conception de token : xDIN, DIN et vente de nœuds
De août à septembre 2024, DIN a organisé une vente de nœuds Chipper et a levé 2,5 millions de dollars. Ces nœuds Chipper permettront aux utilisateurs d'exécuter un logiciel de validation sur leurs appareils locaux, utilisant des modèles pour s'assurer que les données sont annotées correctement. Cette vente a été un grand succès, avec 25 112 nœuds secondaires (chacun au prix de 99 dollars) vendus.
Côté offre :
Avant la TGE, les utilisateurs de xData peuvent échanger leurs points wafers contre des xDIN - le token avant l'airdrop. Cependant, il y aura des frais d'échange de 5 à 30 %, ces frais étant répartis entre les propriétaires de nœuds Chipper. Ce mécanisme d'échange n'est pas encore en ligne, mais devrait être lancé immédiatement lorsque le "pré-minage" des nœuds sera mis en ligne plus tard ce mois-ci.
Lors de la TGE, les utilisateurs recevront un airdrop de DIN (token échangeable) basé sur leur proportion de xDIN, entièrement libéré, sans mécanisme de verrouillage complexe.
Après la TGE, 25 % de l'offre totale de tokens DIN sera réservée aux récompenses des nœuds Chipper. La moitié de cette allocation sera libérée la première année, le reste étant libéré chaque année par moitié.
Il convient de noter que la vitesse de déverrouillage de cette vente est relativement rapide par rapport à d'autres projets qui effectuent des ventes de nœuds, où les récompenses de nœud sont progressivement distribuées sur 3-4 ans.
Côté demande :
Les nœuds de validation pourraient avoir besoin de staker des tokens DIN pour participer au réseau. En retour, ils seront récompensés pour la validation des données, mais s'ils produisent des résultats inexacts, ils risquent d'être pénalisés.
À l'autre bout, les utilisateurs de données doivent utiliser des tokens DIN pour accéder aux données du réseau. Étant donné que la plupart des entreprises Web2 hésitent encore à utiliser des cryptomonnaies, l'entreprise devra faciliter ces transactions pour établir un pont entre les entreprises traditionnelles et les réseaux décentralisés.
Nous attendons toujours la publication des détails sur l'économie des tokens DIN, qui devrait être publiée à l'approche de la TGE.
Équipe et financement :
L'équipe centrale de DIN rassemble des talents issus de l'Université de Columbia, de l'University College de Londres et de l'Université de Stuttgart, possédant une expertise de dix ans dans les domaines de l'IA et de la blockchain.
Le fondateur de DIN, Hao Ding, détient un master en technologie de l'information de l'Université de Stuttgart. Avant d'étudier en profondeur les cryptomonnaies, il a été directeur de recherche à l'Institut de recherche sur l'intelligence artificielle de Suzhou, en Chine, puis vice-président du réseau oracle d'identification Litentry, avant de fonder Web3Go.
J'étais ravi de rencontrer Hao en personne, et nous avons discuté de l'avenir de l'intelligence artificielle. Si vous me demandez quelle est sa conviction ? C'est que : les données seront au cœur de tout. L'équipe DIN compte actuellement 16 membres, la plupart étant des ingénieurs.
DIN a participé au programme d'accélérateur MVB 5 des laboratoires Binance et a levé 4 millions de dollars lors d'un tour de financement de démarrage en juillet 2023, dirigé par les laboratoires Binance, HashKey, NGC et Shima Capital. En août 2024, DIN a obtenu 4 millions de dollars supplémentaires, avec des investissements de Manta Network, Moonbeam Network, Ankr et Maxx Capital, portant son total à 8 millions de dollars.
6. Nos idées
Idée 1 : Créer un Scale AI décentralisé est une idée amusante.
La collecte et l'annotation de données représentent un gros marché.
Scale AI est l'un des acteurs les plus connus dans ce domaine, avec un revenu récurrent d'environ 1 milliard de dollars par an. Cela est alimenté par une forte demande de la part d'entreprises de modèles d'intelligence artificielle fondamentaux comme OpenAI, Anthropic et Cohere, qui sont les principaux clients de Scale. À partir de mai 2024, la valorisation de l'entreprise pourrait atteindre 14 milliards de dollars.
Jetons un œil au modèle commercial de Scale AI.
Les tâches d'annotation des données de Scale dépendent d'une main-d'œuvre distribuée massive, y compris le tagging manuel de vidéos, la classification de photos et la transcription de l'audio.
L'entreprise emploie environ 240 000 travailleurs dans plusieurs pays et recrute activement dans des régions à fort taux de chômage et à faible coût de la vie. Par exemple, le Kenya est devenu un centre de recrutement important en Afrique, avec un "camp d'entraînement pour nouveaux venus" à Nairobi et des publicités ciblées pour attirer des travailleurs.
Le processus d'annotation comporte généralement deux niveaux : le premier niveau est celui des annotateurs, qui annotent les données à partir de zéro ; le deuxième niveau est celui des contrôleurs de qualité, qui vérifient le travail, ajoutent des annotations manquantes et corrigent les erreurs. C'est un travail intensif en main-d'œuvre, mais c'est très efficace car le coût de la main-d'œuvre est bas et les clients sont prêts à payer des montants considérables.
Maintenant, imaginez étendre ce modèle via un réseau décentralisé. Des travailleurs sans autorisation, incités par des tokens à l'échelle mondiale, pourraient permettre à quiconque de participer, tandis qu'un réseau de validation distribué pourrait garantir l'exactitude et la qualité des données. La décentralisation pourrait ouvrir de nouvelles possibilités pour l'échelle de l'annotation des données, transformant cela en un véritable processus de démocratisation mondial.
Idée 2 : Une grande base d'utilisateurs = une bonne chose
L'avantage principal de DIN aujourd'hui réside dans sa vaste communauté engagée, bâtie grâce à plus de deux ans d'efforts concentrés sur le développement communautaire. Avec un tel réseau, DIN peut rapidement mobiliser la collecte de données selon des critères spécifiques. Cependant, le défi consiste à identifier où se trouve la véritable demande de données, à guider les utilisateurs pour collecter et annoter les ensembles de données corrects, et à établir des flux de revenus durables pour soutenir la croissance à long terme.
Idée 3 : Les incitations sont une arme à double tranchant
Actuellement, la plupart de l'engagement des utilisateurs est alimenté par une attente de récompenses en tokens après la sortie des tokens. Mais si l'équipe ne parvient pas à générer suffisamment de demande pour les tokens après leur lancement, l'utilisation des tokens pourrait diminuer à mesure que l'intérêt initial s'estompe. Créer cette demande nécessite un intérêt spéculatif et construire un marché de consommateurs de données composé d'acheteurs désireux d'acquérir ces ensembles de données.
Idée 4 : L'annotation des données est un domaine très compétitif.
DIN n'est pas la seule équipe crypto à se battre pour cette part de marché - des projets comme Sapiens, Grass et Masa sont également en concurrence. Mais le gâteau est énorme. Prenez GRASS, par exemple, qui a actuellement une capitalisation boursière de 2,5 milliards de dollars, soulignant l'énorme opportunité dans ce secteur.
Une voie par laquelle DIN pourrait se distinguer de ses concurrents est de former et déployer des modèles d'intelligence artificielle propriétaires pour la vérification des données, réduisant ainsi la dépendance à la main-d'œuvre humaine. Cette approche axée sur l'automatisation peut simplifier les opérations, améliorer l'évolutivité et donner à DIN un avantage par rapport à des concurrents qui dépendent encore fortement des opérations manuelles.
7. Conclusion
Les réseaux de données sont l'un des terrains les plus excitants à l'intersection de l'IA et de la crypto. Contrairement aux modèles centralisés traditionnels, les réseaux de données alimentés par la crypto exploitent la participation décentralisée et les mécanismes d'incitation pour construire à grande échelle des ensembles de données de haute qualité.
DIN se positionne comme un pionnier dans ce domaine, et il sera fascinant de suivre l'évolution de ce projet. C'est une opportunité que DIN doit saisir. Je dis souvent aux gens : le réseau de données est l'un des domaines les plus judicieux à développer actuellement.
Crypto redéfinit la manière dont les données sont collectées, vérifiées et monétisées, posant les bases d'une nouvelle économie de données décentralisée.