Autor: Mahesh Ramakrishnan, Vinayak Kurup, CoinDesk Compilador: Tao Zhu, Golden Finance;

A finales de julio, Mark Zuckerberg escribió una carta explicando por qué "el código abierto es esencial para un futuro positivo de la IA", en la que elogiaba la necesidad del desarrollo de la IA de código abierto. El fundador, que alguna vez fue un adolescente nerd, ahora se ha convertido en "Zuckerberg", que practica esquí acuático, usa cadenas de oro y practica jujitsu, y es conocido como el salvador del desarrollo de modelos de código abierto.

Pero hasta ahora, él y el equipo de Meta no han detallado cómo se implementarán estos modelos. A medida que aumenta la complejidad del modelo en los requisitos computacionales, ¿estamos sucumbiendo a una forma similar de centralización si la implementación del modelo está controlada por un pequeño número de actores? La IA descentralizada promete resolver este desafío, pero la tecnología requiere avances en criptografía líder en la industria y soluciones híbridas únicas.

A diferencia de los proveedores de nube centralizados, la IA descentralizada (DAI) distribuye los procesos computacionales de inferencia y entrenamiento de IA en múltiples sistemas, redes y ubicaciones. Si se implementan correctamente, estas redes (una red de infraestructura física descentralizada (DePIN)) traerán beneficios en términos de resistencia a la censura, acceso computacional y costo.

DAI enfrenta desafíos en dos áreas principales: el entorno de IA y la propia infraestructura descentralizada. En comparación con los sistemas centralizados, DAI requiere salvaguardias adicionales para evitar el acceso no autorizado a los detalles del modelo o el robo y copia de información patentada. Por lo tanto, existe una oportunidad subexplotada para los equipos que se centran en modelos de código abierto pero reconocen las posibles desventajas de rendimiento de los modelos de código abierto en comparación con los modelos de código cerrado.

Los sistemas descentralizados enfrentan particularmente obstáculos relacionados con la integridad de la red y la sobrecarga de recursos. Por ejemplo, distribuir datos de clientes entre diferentes nodos expone más vectores de ataque. Un atacante puede activar un nodo y analizar sus cálculos, intentar interceptar transferencias de datos entre nodos o incluso introducir sesgos que degraden el rendimiento del sistema. Incluso en modelos de inferencia descentralizados seguros, debe haber mecanismos para auditar el proceso computacional. Los nodos ahorran costos de recursos al generar cálculos incompletos y la verificación se complica por la falta de un participante centralizado confiable.

Prueba de conocimiento cero

Las pruebas de conocimiento cero (ZKP), si bien actualmente son computacionalmente prohibitivas, son una posible solución a algunos de los desafíos de DAI. ZKP es un mecanismo criptográfico que permite a una parte (el probador) convencer a otra parte (el verificador) de la veracidad de una declaración sin revelar ningún detalle sobre la declaración en sí, excepto su validez. Esta prueba puede ser verificada rápidamente por otros nodos y proporciona a cada nodo una forma de demostrar que actuó de acuerdo con el protocolo. Demostrar las diferencias técnicas entre el sistema y su implementación (más sobre esto más adelante) es importante para los inversores en este espacio.

La informática centralizada limita la formación de modelos a unos pocos participantes bien posicionados y ricos en recursos. ZKP podría ser parte del desbloqueo de la informática inactiva en el hardware de consumo; por ejemplo, una MacBook podría utilizar su ancho de banda informático adicional para ayudar a entrenar modelos de lenguaje grandes y al mismo tiempo ganar tokens para los usuarios.

La implementación de capacitación o inferencia descentralizada utilizando hardware de consumo es un objetivo de equipos como Gensyn e Inference Labs; a diferencia de las redes informáticas descentralizadas como Akash o Render, la fragmentación informática agrega complejidad, es decir, problemas de punto flotante. Aprovechar los recursos informáticos distribuidos inactivos abre la puerta para que los pequeños desarrolladores prueben y entrenen sus propias redes, siempre que tengan acceso a herramientas que resuelvan los desafíos relevantes.

Actualmente, los sistemas ZKP parecen ser de cuatro a seis órdenes de magnitud más caros que ejecutar el cálculo localmente, lo que hace que el uso de ZKP sea muy lento para tareas que requieren un alto nivel de cálculo (como el entrenamiento de modelos) o baja latencia (como la inferencia de modelos). En comparación, una caída de seis órdenes de magnitud significa que los sistemas de vanguardia (como el Jolt del a16z) que se ejecutan en un chip M3 Max demuestran programas que son 150 veces más lentos que los que se ejecutan en una calculadora gráfica TI-84.

La capacidad de la IA para procesar grandes cantidades de datos la hace compatible con las pruebas de conocimiento cero (ZKP), pero se necesitan más avances en criptografía antes de que las ZKP puedan usarse ampliamente. El trabajo continuo de equipos como Irreducible (que diseñó el sistema de prueba y el esquema de compromiso de Binius), Gensyn, TensorOpera, Hellas e Inference Labs será un paso importante hacia la realización de esta visión. Sin embargo, el cronograma sigue siendo demasiado optimista, ya que la innovación real requiere tiempo y avances matemáticos.

Al mismo tiempo, cabe destacar otras posibilidades y soluciones híbridas. HellasAI y otras empresas están desarrollando nuevas formas de representar modelos y cálculos que permitan juegos de desafío optimistas, permitiendo solo el subconjunto de cálculos que deben procesarse con conocimiento cero. Las pruebas optimistas sólo funcionan si existe una amenaza creíble de apuesta, la capacidad de demostrar irregularidades y otros nodos en el sistema verifican el cálculo. Otro método desarrollado por Inference Labs valida un subconjunto de consultas, donde un nodo se compromete a producir un ZKP con un depósito, pero solo proporciona pruebas si el cliente primero lo cuestiona.

Resumir

El entrenamiento y la inferencia de IA descentralizados servirán como salvaguardia contra algunos actores importantes que consolidan su poder y al mismo tiempo desbloquean una informática que antes era inaccesible. ZKP será fundamental para hacer realidad esta visión. Su computadora podrá ganar dinero real sin siquiera darse cuenta utilizando la potencia de procesamiento adicional en segundo plano. Una prueba concisa de que los cálculos se realizaron correctamente haría innecesaria la confianza explotada por los proveedores de nube más grandes, lo que permitiría que las redes informáticas con proveedores más pequeños atrajeran clientes empresariales.

Si bien las pruebas de conocimiento cero permitirán este futuro y se convertirán en una parte importante de algo más que redes computacionales (como la visión de Ethereum de finalidad de una sola ranura), su sobrecarga computacional sigue siendo un obstáculo. Una solución híbrida que combine la mecánica de la teoría de juegos de los juegos optimistas con el uso selectivo de pruebas de conocimiento cero es una mejor solución y probablemente se convertirá en el punto de enlace omnipresente hasta que ZKP se vuelva más rápido.

Tanto para los inversores nativos como para los no nativos en criptomonedas, comprender el valor y los desafíos de los sistemas de inteligencia artificial descentralizados es fundamental para implementar el capital de manera efectiva. El equipo debería tener respuestas a preguntas sobre pruebas computacionales de nodos y redundancia de red. Además, como hemos observado en muchos proyectos DePIN, la descentralización ocurre con el tiempo y es fundamental que el equipo tenga un plan claro para lograr esta visión. Resolver los desafíos asociados con la informática DePIN es fundamental para devolver el control a individuos y pequeños desarrolladores, una parte esencial para mantener nuestros sistemas abiertos, gratuitos y resistentes a la censura.