A fines de julio, Mark Zuckerberg escribió una carta en la que explicaba por qué “el código abierto es necesario para un futuro positivo de la IA”, en la que se explaya sobre la necesidad de desarrollar una IA de código abierto. El fundador, que en su día fue un adolescente nerd y ahora se ha convertido en el “Zuck” que practica wakeboard, lleva cadenas de oro y lucha contra el jiu-jitsu, ha sido calificado como el mesías del desarrollo de modelos de código abierto.

Pero hasta ahora, él y el equipo de Meta no han explicado mucho sobre cómo se están implementando estos modelos. A medida que la complejidad de los modelos aumenta los requisitos de cómputo, si la implementación de los modelos está controlada por un puñado de actores, ¿no hemos sucumbido a una forma similar de centralización? La IA descentralizada promete resolver este desafío, pero la tecnología requiere avances en técnicas criptográficas líderes en la industria y soluciones híbridas únicas.

Este artículo de opinión es parte del nuevo Vertical DePIN de CoinDesk, que cubre la industria emergente de la infraestructura física descentralizada.

A diferencia de los proveedores de nube centralizados, la IA descentralizada (DAI) distribuye los procesos computacionales para la inferencia y el entrenamiento de la IA entre múltiples sistemas, redes y ubicaciones. Si se implementan correctamente, estas redes, un tipo de red de infraestructura física descentralizada (DePIN), brindan beneficios en cuanto a resistencia a la censura, acceso computacional y costos.

DAI enfrenta desafíos en dos áreas principales: el entorno de IA y la propia infraestructura descentralizada. En comparación con los sistemas centralizados, DAI requiere salvaguardas adicionales para evitar el acceso no autorizado a los detalles del modelo o el robo y la replicación de información confidencial. Por este motivo, existe una oportunidad poco explorada para los equipos que se centran en modelos de código abierto, pero reconocen la posible desventaja de rendimiento de los modelos de código abierto en comparación con sus contrapartes de código cerrado.

Los sistemas descentralizados se enfrentan específicamente a obstáculos en la integridad de la red y la sobrecarga de recursos. La distribución de datos de clientes entre nodos separados, por ejemplo, expone más vectores de ataque. Los atacantes podrían poner en marcha un nodo y analizar sus cálculos, intentar interceptar transmisiones de datos entre nodos o incluso introducir sesgos que degraden el rendimiento del sistema. Incluso en un modelo de inferencia descentralizado seguro, deben existir mecanismos para auditar los procesos de cómputo. Los nodos tienen incentivos para ahorrar costos en recursos presentando cálculos incompletos, y la verificación se complica por la falta de un actor centralizado y confiable.

Pruebas de conocimiento cero

Las pruebas de conocimiento cero (ZKP), si bien actualmente son demasiado costosas en términos computacionales, son una posible solución a algunos desafíos de la DAI. Las ZKP son un mecanismo criptográfico que permite a una parte (el probador) convencer a otra parte (el verificador) de la verdad de una declaración sin divulgar ningún detalle sobre la declaración en sí, excepto su validez. La verificación de esta prueba es rápida para que otros nodos la ejecuten y ofrece una forma para que cada nodo demuestre que actuó de acuerdo con el protocolo. Las diferencias técnicas entre los sistemas de prueba y sus implementaciones (profundizaremos en esto más adelante) son importantes para los inversores en el espacio.

La computación centralizada hace que el entrenamiento de modelos sea exclusivo para un puñado de jugadores bien posicionados y con recursos. Los ZKP podrían ser una parte del desbloqueo de la computación inactiva en el hardware de consumo; una MacBook, por ejemplo, podría usar su ancho de banda computacional adicional para ayudar a entrenar un modelo de lenguaje grande mientras gana tokens para el usuario.

Implementar entrenamiento o inferencia descentralizados con hardware de consumo es el foco de atención de equipos como Gensyn e Inference Labs; a diferencia de una red informática descentralizada como Akash o Render, la fragmentación de los cálculos agrega complejidad, en particular el problema del punto flotante. El uso de recursos informáticos distribuidos inactivos abre la puerta a que los desarrolladores más pequeños prueben y entrenen sus propias redes, siempre que tengan acceso a herramientas que resuelvan los desafíos asociados.

En la actualidad, los sistemas ZKP son aparentemente entre cuatro y seis órdenes de magnitud más caros que ejecutar el cálculo de forma nativa, y para tareas que requieren un alto nivel de cálculo (como el entrenamiento de modelos) o una baja latencia (como la inferencia de modelos), el uso de un ZKP es prohibitivamente lento. A modo de comparación, una reducción de seis órdenes de magnitud significa que un sistema de vanguardia (como Jolt de a16z) que se ejecuta en un chip M3 Max puede resultar un programa 150 veces más lento que ejecutarlo en una calculadora gráfica TI-84.

La capacidad de la IA para procesar grandes cantidades de datos la hace compatible con las pruebas de conocimiento cero (ZKP), pero se necesitan más avances en criptografía antes de que las ZKP puedan usarse ampliamente. El trabajo que están realizando equipos como Irreducible (que diseñó el sistema de pruebas y el esquema de compromiso de Binius), Gensyn, TensorOpera, Hellas e Inference Labs, entre otros, será un paso importante para lograr esta visión. Sin embargo, los plazos siguen siendo demasiado optimistas, ya que la verdadera innovación requiere tiempo y avances matemáticos.

Mientras tanto, vale la pena señalar otras posibilidades y soluciones híbridas. HellasAI y otros están desarrollando nuevos métodos de representación de modelos y cálculos que pueden permitir un juego de desafío optimista, permitiendo solo un subconjunto de cálculos que deben manejarse en conocimiento cero. Las pruebas optimistas solo funcionan cuando hay participación, la capacidad de demostrar irregularidades y una amenaza creíble de que el cálculo esté siendo verificado por otros nodos del sistema. Otro método, desarrollado por Inference Labs, valida un subconjunto de consultas donde un nodo se compromete a generar un ZKP con un vínculo, pero solo presenta la prueba si el cliente lo desafía primero.

En suma

El entrenamiento y la inferencia descentralizados de la IA servirán como protección contra la consolidación del poder por parte de unos pocos actores importantes, al tiempo que desbloquearán una computación que antes era inaccesible. Los ZKP serán una parte integral de la habilitación de esta visión. Su computadora podrá hacerle ganar dinero real de manera imperceptible al utilizar potencia de procesamiento adicional en segundo plano. Las pruebas sucintas de que un cálculo se realizó correctamente harán innecesaria la confianza que los proveedores de nube más grandes aprovechan, lo que permitirá que las redes de computación con proveedores más pequeños atraigan a la clientela empresarial.

Si bien las pruebas de conocimiento cero harán posible este futuro y serán una parte esencial de más que solo las redes de cómputo (como la visión de Ethereum para la finalidad de una sola ranura), su sobrecarga computacional sigue siendo un obstáculo. Las soluciones híbridas que combinan la mecánica de la teoría de juegos de los juegos optimistas con el uso selectivo de pruebas de conocimiento cero son una mejor solución y probablemente se volverán omnipresentes como punto de transición hasta que las pruebas de conocimiento cero se vuelvan mucho más rápidas.

Para los inversores en criptomonedas, tanto nativos como no nativos, comprender el valor y los desafíos de los sistemas de IA descentralizados será crucial para desplegar el capital de manera eficaz. Los equipos deben tener respuestas a las preguntas sobre las pruebas de computación de los nodos y las redundancias de la red. Además, como hemos observado en muchos proyectos DePIN, la descentralización se produce con el tiempo y es esencial que los equipos tengan un plan claro para lograr esa visión. Resolver los desafíos asociados con la computación DePIN es esencial para devolver el control a las personas y a los pequeños desarrolladores, una parte vital para mantener nuestros sistemas abiertos, libres y resistentes a la censura.

Nota: Las opiniones expresadas en esta columna son las del autor y no reflejan necesariamente las de CoinDesk, Inc. o sus propietarios y afiliados.