(Anotaciones Gleason optimizadas del conjunto de datos TCGA PRAD) es el resultado de la colaboración entre Codatta y DPath.ai, estableciendo un nuevo estándar para datos de patología listos para IA. A través de la plataforma Codatta, se reunió una comunidad de expertos en patología de primer nivel, este conjunto de datos va más allá de las anotaciones a nivel de corte tradicionales, introduciendo anotaciones espaciales a nivel de ROI, mejorando el nivel de detalle, precisión y transparencia del diagnóstico. Con la Gleason optimizada, razones de anotación detalladas y mapeo de modelos Gleason basados en ROI, este conjunto de datos se convierte en un recurso clave para el desarrollo de modelos de IA e investigación en patología, abordando el desafío crucial de crear datos de anotación de alta calidad. A través del Modelo de Regalías de Codatta, los contribuyentes pueden mantener la propiedad de su trabajo, asegurando su reconocimiento y valor continuo, mientras que DPath.ai demuestra cómo las soluciones colaborativas pueden impulsar el desarrollo de la inteligencia artificial en patología.

Figura 1: Anotación Gleason optimizada del conjunto de datos TCGA PRAD. Fuente de la imagen: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset

¿Qué es el conjunto de datos TCGA PRAD?

Las anotaciones Gleason optimizadas del conjunto de datos TCGA PRAD (Carcinoma de próstata del Proyecto del Genoma del Cáncer) mejoran las anotaciones a nivel de corte originales, incorporando anotaciones espaciales a nivel de ROI. Desarrollado conjuntamente por Codatta y DPath.ai, este conjunto de datos fue creado colaborativamente por la comunidad de patólogos, apoyando la participación global y asegurando la propiedad de las anotaciones. Este método mejora la precisión, el nivel de detalle y la confiabilidad del diagnóstico, elementos clave para el entrenamiento de modelos de IA y la investigación en patología.

Al organizar 435 imágenes de cortes completos del TCGA, los patólogos identificaron 245 casos que requerían mejoras en las anotaciones y confirmaron la precisión de 190 casos. Este conjunto de datos incluye metadatos a nivel de corte y anotaciones espaciales a nivel de ROI, proporcionando a los investigadores un valioso recurso para el desarrollo de pipelines de IA, exploración interactiva de regiones tumorales y estudios avanzados de patología.

Empoderamiento de la IA en patología: Codatta se une a DPath.ai

(Anotaciones Gleason optimizadas del conjunto de datos TCGA PRAD) demuestra el potencial de la creación de datos colaborativa y orientada a la comunidad, al mismo tiempo que mejora la precisión y el nivel de detalle de las anotaciones, haciendo que el entrenamiento de modelos de IA sea más confiable y promoviendo el avance de la investigación médica. Sin embargo, estas contribuciones requieren experiencia en el campo, tiempo y esfuerzo, por lo que se necesita una estructura de incentivos sostenible para reconocer y recompensar el trabajo de los profesionales calificados.

Modelo de Regalías

El Modelo de Regalías de Codatta ofrece una solución para esto. En comparación con modelos tradicionales de Web2 (como Scale AI), mejora la eficiencia en la contribución y obtención de datos. Aunque Scale AI destaca en satisfacer las preferencias de liquidez inmediata de los usuarios comunes, recolectando rápidamente grandes volúmenes de datos de manera eficiente, su alto costo excluye a los pequeños participantes cuando se trata de expertos en el campo realizando tareas especializadas. Codatta, al ofrecer incentivos y recompensas basadas en activos, se alinea con profesionales y expertos calificados. Como se muestra en la figura 2 a continuación, estos incentivos atraen a contribuyentes dispuestos a aportar datos profesionales de alta calidad, aunque las recompensas pueden demorarse, el potencial de ganancias es mayor, haciendo de Codatta una opción ideal para aplicaciones de IA vertical y avanzada que requieren precisión y especialización.

Figura 2: Mapeo de la competencia de habilidades en la contribución de datos y preferencias de liquidez

A diferencia de los altos costos iniciales de Scale AI, el Modelo de Regalías de Codatta elimina las barreras financieras para pequeñas empresas emergentes de IA al introducir un sistema de pago por uso. Este enfoque democratiza el acceso a datos críticos de vanguardia sin necesidad de costosas inversiones iniciales, permitiendo a las startups demostrar su ajuste al mercado y escalar. Además, al convertir los datos en activos líquidos en un mercado financiero descentralizado, Codatta asegura que los contribuyentes puedan equilibrar las necesidades de liquidez a corto plazo con la propiedad de activos a largo plazo. Funciones como contratos de acuerdo y propiedad parcial optimizan aún más la liquidez, haciendo que las recompensas basadas en activos sean más atractivas para un grupo más amplio de contribuyentes. Esta coherencia fomenta la colaboración, impulsa la innovación en aplicaciones de IA de nicho y crea un ecosistema de inversión diversificado para creadores de datos y startups.

DPath.ai: Solución colaborativa para los desafíos de datos de IA en patología

DPath.ai está construyendo una plataforma descentralizada diseñada para conectar patólogos, investigadores y desarrolladores de modelos de IA de todo el mundo. Nos encargamos de la obtención, curaduría e intercambio de datos de patología de alta calidad, permitiendo que cualquier persona interesada en entrenar modelos de IA pueda participar. La plataforma DPath aprovecha la tecnología blockchain para asegurar la transparencia, equidad y seguridad en el intercambio de datos.

Plataformas como DPath.ai pueden aprovechar el protocolo de datos descentralizado de Codatta para obtener anotaciones de manera colaborativa y transparente:

  • Definición de la tarea: estándares de anotación claros (como la clasificación Gleason del cáncer de próstata) que garantizan la consistencia y confiabilidad de los datos resultantes.

  • Participación comunitaria: patólogos expertos de todo el mundo participan a través de la plataforma Codatta y son incentivados por su Modelo de Regalías, obteniendo recompensas continuas vinculadas al valor futuro del conjunto de datos.

  • Calidad e integridad: la validación basada en blockchain y la verificación cruzada entre múltiples partes aseguran anotaciones de alta calidad y trazables, al mismo tiempo que aumentan la responsabilidad de los anotadores.

  • Seguridad y accesibilidad: al almacenar datos de manera descentralizada, la propiedad de los datos se mantiene segura y accesible para las personas relevantes.

Figura 3: Colaboración entre Codatta y DPath.ai. Fuente de la imagen: https://huggingface.co/datasets/Codatta/Refined-TCGA-PRAD-Prostate-Cancer-Pathology-Dataset

Al obtener datos específicos de manera colaborativa, DPath.ai no solo enriqueció el conjunto de datos TCGA PRAD con clasificaciones Gleason precisas, sino que también mostró cómo la plataforma Codatta puede crear datos de vanguardia para el campo de la IA profesional. Este enfoque fomenta la participación sostenible, democratiza la obtención de datos y acelera el desarrollo de sistemas de IA en atención médica que sean justos y eficientes.

Conclusión

(Anotaciones Gleason optimizadas del conjunto de datos TCGA PRAD) es el resultado de la colaboración entre Codatta y DPath.ai, mejorando la precisión diagnóstica y el nivel de detalle de los datos de IA en patología a través de anotaciones a nivel de ROI con razones de anotación. Con la participación de expertos en patología de todo el mundo, este proyecto asegura datos de alta calidad y recompensa a los contribuyentes a través del Modelo de Regalías de Codatta, ofreciendo valor y propiedad continuos. Este enfoque también fomenta la colaboración, mejora la liquidez de los datos, acelera el desarrollo de la IA en atención médica y muestra el poder de las soluciones descentralizadas y orientadas a la comunidad.