Rachel, Jinse Caijing

Le 27 novembre, Zhao Changpeng a publié sur X que les tâches telles que l'annotation des données AI sont très adaptées à être réalisées via la blockchain, en s'appuyant sur une main-d'œuvre mondiale à faible coût et en permettant un paiement immédiat via des cryptomonnaies, brisant ainsi les restrictions géographiques.

L'annotation des données fait référence à l'annotation manuelle ou automatisée de données brutes (telles que du texte, des images, de l'audio, etc.) afin de leur donner des informations structurées spécifiques. Les données annotées sont utilisées pour entraîner des modèles d'apprentissage automatique ou d'intelligence artificielle, par exemple, annoter le texte avec des catégories d'émotions (positive, négative, neutre) est une forme d'annotation de données. L'utilisation de la blockchain pour l'annotation des données d'intelligence artificielle est particulièrement adaptée aux scénarios d'annotation de données nécessitant une grande transparence, une crédibilité et une collaboration distribuée. Cela peut non seulement améliorer l'efficacité et la qualité de l'annotation des données, mais aussi créer de nouvelles possibilités pour la collaboration mondiale et le commerce des données.

Quels sont actuellement les projets de qualité dans cette voie ? Quelles sont les perspectives de développement de la voie ?

Le rôle de la blockchain dans l'annotation des données AI

La blockchain est une technologie de registre distribué décentralisé, caractérisée par la transparence, l'immuabilité et la traçabilité. Ces caractéristiques peuvent résoudre les problèmes suivants rencontrés dans les méthodes traditionnelles d'annotation des données :

  • Véracité des données et protection contre la falsification : Chaque enregistrement d'annotation est écrit dans la blockchain, ne pouvant être modifié à volonté, garantissant ainsi la crédibilité des annotations.

  • Transparence de l'attribution des tâches : La blockchain peut enregistrer le processus de distribution, d'exécution et de vérification des tâches, empêchant ainsi une attribution inéquitable des tâches ou une falsification des résultats.

  • Mécanisme d'incitation : En utilisant la technologie des contrats intelligents de la blockchain, les annotateurs de données peuvent automatiquement recevoir des cryptomonnaies ou d'autres récompenses en accomplissant des tâches.

  • Traçabilité des données : La source de chaque annotation, les annotateurs et les vérificateurs peuvent être suivis.

Scénarios d'application

  • Annotation distribuée : En utilisant la blockchain, les tâches d'annotation de données sont attribuées à des annotateurs du monde entier, rendant le traitement des données plus efficace.

  • Contrôle de qualité : Les résultats des annotations multiples sont comparés et vérifiés via la technologie blockchain, assurant ainsi l'exactitude des annotations.

  • Transaction de données annotées : Les données annotées peuvent être échangées sur la blockchain, les parties acheteuses et vendeuses n'ont pas à s'inquiéter de l'intégrité ou de la véracité des données.

  • Protection de la vie privée : Utiliser la blockchain pour stocker les données annotées de manière cryptée, garantissant la sécurité des données privées.

Projets connexes

  • OORT DataHub : Fournit un service d'annotation de données décentralisé basé sur la blockchain, utilisant l'algorithme Proof of Honesty pour le contrôle de la qualité. Sa plateforme distribue des tâches, vérifie la qualité des données et paie des récompenses via des contrats intelligents, attirant des annotateurs du monde entier et garantissant la transparence des données annotées et la protection de la vie privée.

Le modèle économique du jeton du projet est le suivant :

Récompenses communautaires : En participant à l'annotation et à l'analyse des données, les utilisateurs peuvent recevoir des récompenses en jetons $OORT. De plus, ils peuvent également obtenir des NFT uniques liés à leurs contributions, ces NFT offrant des droits supplémentaires, tels que des récompenses pour augmenter le rendement annuel (APY), des réductions sur des équipements et des droits de vote dans le DAO.

Dépôt de mission : Les participants doivent déposer au moins 210 jetons $OORT pour montrer leur engagement envers la mission, les jetons seront restitués après l'achèvement de la mission et des récompenses seront distribuées.

Partage des revenus de vente : Certains détenteurs de NFT peuvent également bénéficier d'une part des futurs revenus de vente de données, augmentant ainsi le rendement à long terme.

  • PublicAI : Projet écologique d'IA sur la chaîne Solana, visant à connecter les demandeurs de données et les annotateurs mondiaux, récompensant les participants par le biais d'un mécanisme d'incitation en jetons cryptographiques, tout en utilisant la technologie blockchain pour enregistrer les détails du processus d'annotation, garantissant ainsi la sécurité et la confidentialité des données.

Le modèle économique du jeton du projet est le suivant :

Récompenses communautaires : 10 % des jetons Public seront utilisés pour des récompenses d'airdrop pour les interactions initiales des utilisateurs, plus précisément, il y a trois façons d'obtenir l'airdrop : devenir AI Builder : collecter du contenu de haute qualité sur Internet ; devenir AI Validator : valider le contenu collecté ; devenir AI Developer : utiliser des ensembles de données validés pour entraîner des agents IA.

Répartition des jetons : Le projet a complété un financement de 2 millions de dollars lors de son tour de semences en janvier 2024, les investisseurs incluent IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital et plusieurs professeurs renommés dans le domaine de l'intelligence artificielle, les détails spécifiques de la répartition des jetons PublicAI n'ont pas encore été clarifiés.

Défis à relever

Actuellement, plusieurs facteurs entravent le développement de cette voie : d'une part, l'annotation des données AI nécessite des ressources de calcul et de stockage élevées ; d'autre part, les performances du projet sont limitées par l'évolutivité de la blockchain ; enfin, la normalisation technologique et la réglementation ne sont pas encore bien établies.

Parmi eux, le deuxième point est peut-être le plus grand défi auquel nous faisons face actuellement. En effet, l'annotation des données AI et l'entraînement des modèles nécessitent généralement d'importantes ressources de calcul, tandis que la capacité de calcul des nœuds dans le réseau blockchain est limitée. Comment intégrer et utiliser efficacement les ressources de calcul distribuées pour répondre aux besoins de calcul des projets d'annotation de données AI tout en garantissant les caractéristiques décentralisées de la blockchain, est un problème urgent à résoudre. Il est rapporté que Greenfield, une filiale de Binance, fournit un soutien de stockage pour cette voie, espérant que davantage de ressources de stockage et de calcul puissent être mises en pratique dans ce domaine.