Rachel, Golden Finance
El 27 de noviembre, Zhao Changpeng publicó en X que las tareas de etiquetado de datos de IA son muy adecuadas para ser completadas a través de blockchain, aprovechando la mano de obra de bajo costo a nivel global y realizando pagos inmediatos mediante criptomonedas, rompiendo las limitaciones geográficas.
El etiquetado de datos se refiere a la anotación manual o automatizada de datos originales (como texto, imágenes, audio, etc.) para otorgarles información estructurada específica. Los datos etiquetados se utilizan para entrenar modelos de aprendizaje automático o inteligencia artificial; por ejemplo, etiquetar un texto con categorías de sentimientos (positivo, negativo, neutral) es un tipo de etiquetado de datos. El uso de blockchain para el etiquetado de datos de inteligencia artificial es particularmente adecuado para escenarios que requieren alta transparencia, credibilidad y colaboración distribuida. Esto no solo puede mejorar la eficiencia y calidad del etiquetado de datos, sino también crear nuevas posibilidades para la colaboración global y el comercio de datos.
Actualmente, ¿cuáles son los proyectos destacados en este campo? ¿Cuál es el futuro del desarrollo de este sector?
El papel de la blockchain en el etiquetado de datos de IA
La blockchain es una tecnología de libro mayor distribuido descentralizado, que posee características como transparencia, inmutabilidad y trazabilidad. Estas características pueden resolver los siguientes problemas en los métodos tradicionales de etiquetado de datos:
Veracidad de los datos y resistencia a la manipulación: cada registro de etiquetado se escribe en la blockchain y no se puede modificar arbitrariamente, garantizando la credibilidad de la etiqueta.
Transparencia en la asignación de tareas: la blockchain puede registrar el proceso de distribución, ejecución y revisión de tareas, previniendo la asignación injusta de tareas o la manipulación de resultados.
Mecanismo de incentivos: utilizando la tecnología de contratos inteligentes de blockchain, los etiquetadores de datos pueden recibir automáticamente criptomonedas u otras recompensas al completar tareas.
Trazabilidad de los datos: se puede rastrear la fuente de cada etiqueta, así como la información del etiquetador y el revisor.
Escenarios de aplicación
Etiquetado distribuido: utilizando blockchain, las tareas de etiquetado de datos se asignan a etiquetadores de todo el mundo, mejorando la eficiencia del procesamiento de datos.
Revisión de calidad: los resultados de múltiples etiquetadores se comparan y revisan a través de la tecnología blockchain, asegurando la precisión del etiquetado.
Comercio de datos etiquetados: los datos etiquetados pueden ser negociados en la blockchain, sin que las partes compradoras y vendedoras tengan que preocuparse por la integridad o veracidad de los datos.
Protección de la privacidad: se utilizan blockchain para almacenar datos etiquetados de manera encriptada, garantizando la seguridad de los datos privados.
Proyectos relacionados
OORT DataHub: proporciona servicios de etiquetado de datos descentralizados basados en blockchain, utilizando el algoritmo Proof of Honesty para el control de calidad. Su plataforma distribuye tareas, revisa la calidad de los datos y paga recompensas a través de contratos inteligentes, atrayendo a etiquetadores de todo el mundo y asegurando la transparencia de los datos etiquetados y la protección de la privacidad.
El modelo económico del token del proyecto es el siguiente:
Recompensas comunitarias: al participar en el etiquetado y análisis de datos, los usuarios pueden recibir recompensas en tokens $OORT. Además, pueden obtener NFT únicos vinculados a sus contribuciones, estos NFT ofrecen derechos adicionales, como recompensas que aumentan la tasa de rendimiento anual (APY), descuentos en dispositivos y derechos de voto en DAO.
Depósito de tareas: los participantes deben depositar al menos 210 tokens $OORT para demostrar su compromiso con la tarea; después de completar la tarea, se devolverán los tokens y se otorgarán recompensas.
División de ingresos por ventas: algunos titulares de NFT también pueden recibir dividendos de futuros ingresos por ventas de datos, aumentando aún más los rendimientos a largo plazo.
PublicAI: un proyecto de ecosistema de IA en la cadena de Solana, diseñado para conectar a los demandantes de datos y etiquetadores globales, recompensando a los participantes a través de un mecanismo de incentivos de tokens criptográficos, mientras utiliza la tecnología blockchain para registrar los detalles del proceso de etiquetado, asegurando la seguridad y privacidad de los datos.
El modelo económico del token del proyecto es el siguiente:
Recompensas comunitarias: el 10% de los tokens Public se destinarán a recompensas de airdrop por la interacción temprana de los usuarios; en concreto, hay tres formas de obtener el airdrop: convertirse en AI Builder: recopilar contenido de alta calidad de Internet; convertirse en AI Validator: validar el contenido recopilado; convertirse en AI Developer: utilizar conjuntos de datos verificados para entrenar agentes de IA.
Distribución de tokens: el proyecto completó una financiación de ronda semilla de 2 millones de dólares en enero de 2024, con inversores que incluyen a IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital y varios académicos destacados en el campo de la inteligencia artificial; actualmente, los detalles específicos de la distribución de tokens PublicAI aún no se han definido.
Desafíos a enfrentar
Actualmente, varios factores limitan el desarrollo de este campo: primero, el etiquetado de datos de IA requiere recursos de computación y almacenamiento relativamente altos; segundo, el rendimiento del proyecto está restringido por la escalabilidad de la blockchain; tercero, la estandarización de la tecnología y la regulación aún son insuficientes.
Entre ellos, el segundo punto es quizás el mayor desafío que enfrenta actualmente. Debido a que el etiquetado de datos de IA y el entrenamiento de modelos generalmente requieren una gran cantidad de recursos computacionales, la capacidad de cómputo de los nodos en la red blockchain es limitada. Cómo integrar y utilizar efectivamente los recursos de computación distribuidos para satisfacer las necesidades de cómputo del proyecto de etiquetado de datos de IA, garantizando al mismo tiempo las características de descentralización de la blockchain, es un problema urgente por resolver. Se informa que Greenfield, una subsidiaria de Binance, está proporcionando soporte de almacenamiento para este campo, esperando que haya más recursos de almacenamiento y computación en esta área.