"SUS DATOS SON MONEDA. LOS DATOS COLECTIVOS SON PODER". (Tus datos son dinero. Los datos colectivos son poder). La empresa Reddit Data DAO (r/datadao) reproduce este ruidoso eslogan en su sitio web oficial.

r/datadao es una organización descentralizada de datos que permite a los usuarios proporcionar datos de Reddit a la plataforma: los usuarios votan sobre cómo usar los datos, como autorizarlos a empresas de inteligencia artificial para la capacitación de modelos grandes, y reciben recompensas por ello. La narrativa de que r/datadao recupera los derechos sobre los datos de los usuarios es sin duda emocionante, porque toca el punto débil actual de la industria de los datos: la dificultad para equilibrar los derechos de información personal y las necesidades de la industria.

Los datos se convierten en petróleo, pero parece no tener nada que ver con los usuarios

La aparición de aplicaciones de inteligencia artificial generativa en los últimos años ha hecho que el valor de los datos sea cada vez más prominente. Big data, gran potencia informática y algoritmos sólidos se denominan la troika de grandes modelos. En la Conferencia Mundial de Inteligencia Artificial (WAIC) de 2023, el informe "Diez principales tendencias en inteligencia artificial" señaló que "la calidad de un modelo futuro estará determinada en un 20% por el algoritmo y en un 80% por la calidad de los datos". "

Basura dentro basura fuera. Por eso los datos se llaman el nuevo petróleo.

Una vista completa de todos los conjuntos de datos desde 2018 hasta principios de 2022 para modelos de lenguaje seleccionados desde GPT-1 hasta Gopher. Tamaño no ponderado en GB. Fuente de la imagen: Alan D. Thompson

Sin embargo, la fuerte demanda de datos de grandes modelos se ha vuelto tensa con derechos e intereses legítimos como la privacidad personal y la seguridad de los datos. Una gran cantidad de información personal se obtiene y comercializa ilegalmente en el mercado negro, convirtiéndose en una fuente de datos para el telemercadeo, el fraude y el marketing de precisión.

En 2016, la Unión Europea introdujo el GDPR (Reglamento General de Protección de Datos) y comenzó su implementación dos años después. El RGPD otorga a las personas un fuerte control sobre los datos y establece una serie de sistemas que incluyen el consentimiento informado, el derecho al olvido, el derecho a la portabilidad de los datos, el derecho de acceso, etc. Sin embargo, algunos críticos creen que una fuerte supervisión y estrictas medidas punitivas han perjudicado el desarrollo de Internet. En China, a través de leyes como la Ley de Ciberseguridad (aprobada en 2016), el Código Civil (aprobada en 2020), la Ley de Seguridad de Datos (aprobada en 2021) y la Ley de Protección de Información Personal (aprobada en 2021), nuestro país ha También construyó un sistema para promover el desarrollo de datos. Utilizar y proteger los derechos e intereses legítimos de individuos y organizaciones, así como el sistema de equilibrio de intereses entre la seguridad nacional y el desarrollo.

Aunque los derechos de información personal se han convertido en un derecho de personalidad jurídica, todavía es difícil para las personas obtener una parte de las transacciones de datos. Reddit reveló en su prospecto de oferta pública inicial en febrero de 2024 que había logrado unos ingresos totales de 203 millones de dólares mediante la firma de acuerdos de licencia de datos con empresas de inteligencia artificial. Pero los usuarios que crearon los datos no obtienen ni un centavo de ellos. El abogado Huang de Mankiw Law Firm cree que existen tres razones principales:

Uno: los datos personales individuales son básicamente inútiles y sólo los “grandes datos” tienen significado para los procesadores de datos.

Segundo: las personas cuentan con procedimientos legales de consentimiento informado para todos los aspectos de la circulación de datos, y las cadenas de autorización complejas e inestables dificultan la realización de transacciones.

Tercero: a través de la solución de procesamiento ideal de "anonimización", es decir, el proceso de procesamiento de información personal que no puede identificar a personas físicas específicas y no puede restaurarse, hará que los datos personales pierdan valor, otras soluciones técnicas, como la informática de privacidad, aún se encuentran en la etapa de exploración; .

Esto crea una situación en la que los procesadores realmente quieren usar información personal, pero no están completamente autorizados por los grandes usuarios que quieren beneficiarse, pero no tienen canales para administrar e intercambiar información personal; Este problema ha preocupado durante mucho tiempo a los responsables políticos, el mundo académico y la industria.

Los importantes "Veinte artículos de datos" publicados en diciembre de 2022 proponen explorar un mecanismo para que los fideicomisarios representen intereses personales y supervisen la recopilación, el procesamiento y el uso de datos de información personal por parte de las entidades del mercado.

Actualmente, existen muy pocos productos de datos personales en los intercambios de datos nacionales. Este año, Shenzhen Data Exchange diseñó un producto de comercio de datos de higiene personal que implementa el concepto de "Veinte datos" hasta cierto punto. El marco básico es mejorar la eficiencia de la autorización descentralizada de datos personales a través de una plataforma de servicio de autorización unificada, al tiempo que se logran beneficios personales.

En este poder/lucha entre individuos y empresas por los datos, ¿por qué la DAO de datos cree que puede ayudar a los usuarios a recuperar sus derechos sobre los datos?

Data DAO: qué es y por qué

Data DAO (Organización Autónoma Descentralizada) es una organización autónoma descentralizada basada en la tecnología blockchain que tiene como objetivo gestionar y utilizar activos de datos a través de un mecanismo de gobernanza colectiva. Logra una gestión de datos transparente, inalterable y segura a través de contratos inteligentes y tecnología de almacenamiento descentralizado. El núcleo de la DAO de datos es transferir la propiedad y los derechos de gestión de los datos desde las plataformas centralizadas tradicionales a los propietarios reales de los datos, es decir, los usuarios.

En la actualidad, el proyecto de datos DAO que ha tomado forma es r/datadao. El abogado Huang de Mankiw Law Firm también realizará un análisis de cumplimiento basado en el modelo de negocio del proyecto.

Modelo de negocio de r/datadao

almacenamiento de datos

La red subyacente de r/datadao es la red Vana, que está diseñada para servir a la gestión y gobernanza descentralizada de datos. Utiliza IPFS (Sistema de archivos interplanetario) como una de sus soluciones de almacenamiento descentralizado para respaldar el almacenamiento seguro y el procesamiento eficiente de datos clave. conjuntos para proyectos como /datadao. Por lo tanto, cuando los usuarios de r/datadao cargan sus datos de actividad en Reddit (como publicaciones y comentarios) en la plataforma, los datos se descentralizan y almacenan a través de la tecnología IPFS. El usuario tiene la clave privada para el almacenamiento y la transmisión de datos, garantizando así los datos. seguridad y control de acceso.

Incentivos

Al contribuir con datos de Reddit a r/datadao, los usuarios pueden obtener el token nativo $RDAT. Estos tokens no sólo representan contribuciones a los datos, sino que también permiten a los usuarios participar en las decisiones de gobernanza de la plataforma. $RDAT se asigna en función del valor de Karma de un usuario en Reddit, que es una medida de la actividad y contribución de la comunidad de un usuario.

gobernanza comunitaria

r/datadao implementa una gobernanza descentralizada, lo que significa que todas las decisiones importantes, como políticas de uso de datos, asociaciones y actualizaciones de plataformas, se deciden mediante los votos de los usuarios que poseen $RDAT. Esto garantiza transparencia y equidad en las operaciones de la plataforma.

Modelo de uso y beneficio de datos:

Los miembros de la comunidad pueden votar sobre cómo se utilizan los datos agrupados. Las opciones pueden incluir la concesión de licencias de datos a empresas de inteligencia artificial para la capacitación de modelos grandes o el intercambio de datos con otras empresas e instituciones de investigación. De esta manera, r/datadao puede generar ingresos y luego distribuir una parte de los ingresos a los contribuyentes de datos en forma de tokens.

Privacidad y seguridad de datos:

Aunque los usuarios envían datos personales a r/datadao, la plataforma garantiza la privacidad y seguridad de estos datos mediante tecnología de cifrado y descentralización. Esto significa que los datos no pueden divulgarse ni utilizarse indebidamente sin la autorización explícita del usuario.

Se puede ver que, en comparación con los "Datos Veinte Artículos" y el plan de la Bolsa de Shenzhen, el DAO de datos también tiene la naturaleza de gestión encomendada de datos personales. La diferencia es que los usuarios tienen más autonomía, así como el DAO de datos y la tecnología blockchain. Relación profunda con los tokens.

La importancia de los datos DAO se refleja en:

1. Al agregar grandes cantidades de datos personales, las personas pueden estar representadas para mejorar su posición negociadora. Los datos que posee un solo usuario no sólo tienen un valor limitado, sino que también se encuentran en una posición débil y fácilmente explotable en las transacciones. WPS alguna vez permitió que la plataforma usara documentos de usuario para capacitación en inteligencia artificial en su política de privacidad, lo que causó una controversia generalizada. A través de datos DAO, se puede aumentar el valor de transacción de los datos personales.

Como dijo r/datadao en el sitio web oficial: Reddit ha vendido nuestros datos por 60 millones de dólares al año y espera ganar 200 millones de dólares al año con nuestros datos. Si nos unimos, podemos luchar contra Reddit.

2. Promover el cumplimiento y circulación de datos. Las empresas de inteligencia artificial como wps enfrentan dificultades a la hora de utilizar datos personales. A veces, bajo una competencia feroz, los datos se obtienen a través de rastreadores web ilegales (sin pasar por el protocolo Robots) y términos de licencia de Overlord. De esta manera, las empresas de IA son extremadamente vulnerables a acusaciones de competencia desleal, derechos de propiedad intelectual, privacidad y otros aspectos. Las organizaciones de datos DAO como r/datadao proporcionarán al mercado datos más compatibles.

ChatGPT responde "¿A qué demandas se enfrenta openai?"

3. Romper los monopolios y los muros de datos. Las empresas de Internet construyen fosos ocupando datos. Durante mucho tiempo, los datos entre varias plataformas no han estado interconectados y ni siquiera los usuarios tienen propiedad sobre los datos. En los últimos años, con la profundización de la aplicación de la ley antimonopolio, sólo ha habido avances como la apertura directa de enlaces de Taobao en WeChat. El derecho a transferir información personal estipulado en la Ley de Protección de Información Personal está inactivo porque no se puede operar. La aparición de datos DAO puede brindar a las empresas de Internet una nueva salida para los datos personales, activar el derecho a transferir información personal y devolver datos a las personas.

Operación de cumplimiento de datos DAO

Los DAO de datos tokenizados, además de enfrentar problemas de cumplimiento como la selección de la ubicación de la operación, la lucha contra el lavado de dinero, la identificación de clientes, la supervisión multijurisdicción, etc. que existen en la industria del cifrado, también deben prestar especial atención al cumplimiento de los datos.

consentimiento informado

Data DAO requiere el consentimiento por escrito de las personas para recopilar y almacenar información personal. La DAO de datos debe utilizar de manera visible y un lenguaje claro y comprensible para informar de manera verdadera, completa y precisa a las personas sobre el propósito del procesamiento, los métodos de procesamiento, los tipos de información procesada, los períodos de retención, los procedimientos de ejercicio de derechos, etc.

Una votación mayoritaria no obliga a los oponentes a utilizar su información personal de acuerdo con los resultados de la votación.

Información sensible e información sobre menores

La información personal sensible se refiere a información personal que, una vez filtrada o utilizada ilegalmente, podría fácilmente infringir la dignidad de una persona física o poner en peligro la seguridad personal y de la propiedad, incluidos datos biométricos, creencias religiosas, identidades específicas, salud médica, finanzas. cuentas, paradero y otra información e información personal de menores.

Los procesadores de información personal pueden procesar información personal sensible solo cuando existe un propósito específico y una necesidad suficiente, y se toman medidas de protección estrictas. Al procesar información de menores, se debe obtener el consentimiento de los tutores y se deben formular reglas especiales para el procesamiento de información personal.

Datos transfronterizos

Tomando a China como ejemplo, los procesadores de información personal que manejan una cierta cantidad de información personal deben almacenar la información personal recopilada y generada dentro del país, y la exportación de datos debe pasar una evaluación de seguridad por parte de la Administración del Ciberespacio.

Seguridad de datos

Prevenir el acceso no autorizado y la fuga, manipulación y pérdida de información personal mediante la formulación de sistemas de gestión internos y procedimientos operativos, adoptando cifrado, desidentificación y otras medidas técnicas de seguridad adecuadas y otros medios técnicos y de gestión.

Dependiendo del tipo de datos, los escenarios de uso de datos y las jurisdicciones regulatorias, todavía hay muchas regulaciones que deben seguirse. Se recomienda que la DAO de datos busque más consultas con un abogado.

Resumir

La narrativa de que la DAO de datos ayuda a los usuarios a recuperar sus derechos de datos es sin duda emocionante, y el acuerdo descentralizado parece realmente ayudar a devolver los derechos de datos a los usuarios. Sin embargo, la tendencia a la tokenización complica el problema. Frente a una fuerte supervisión dual de las industrias de tokens y de datos, ¿significa que la DAO de datos no puede obtener un certificado de nacimiento legal? En cualquier caso, esta es una dirección de comercio de datos que se puede explorar.

Por otro lado, los intercambios de datos nacionales, el Tree Map Blockchain Research Institute, etc. han propuesto un plan totalmente compatible para construir una plataforma de comercio de datos personales utilizando tecnología blockchain. Este tipo de datos DAO se puede utilizar a gran escala. aplicación, existe una certeza política relativamente mayor.