Según Cointelegraph, un equipo de científicos de Bélgica ha resuelto un problema importante en el campo de la inteligencia artificial (IA) mediante un método de entrenamiento descentralizado basado en blockchain. Aunque la investigación se encuentra en sus primeras etapas, podría tener implicaciones de gran alcance, desde revolucionar la exploración espacial hasta plantear riesgos existenciales para la humanidad.
En un entorno simulado, los investigadores crearon un método para coordinar el aprendizaje entre agentes de IA autónomos e individuales. Utilizaron la tecnología blockchain para facilitar y proteger las comunicaciones entre estos agentes, formando un "enjambre" descentralizado de modelos de aprendizaje. Los resultados del entrenamiento de cada agente se utilizaron luego para desarrollar un modelo de IA más grande. Al manejar los datos a través de la blockchain, el sistema se benefició de la inteligencia colectiva del enjambre sin acceder a los datos de los agentes individuales.
El aprendizaje automático, estrechamente relacionado con la IA, se presenta en diversas formas. Los chatbots típicos como ChatGPT de OpenAI o Claude de Anthropic se desarrollan utilizando múltiples técnicas, incluido el aprendizaje no supervisado y el aprendizaje de refuerzo a partir de la retroalimentación humana. Un desafío importante con este enfoque es la necesidad de bases de datos centralizadas para los datos de entrenamiento, lo que resulta poco práctico para aplicaciones que requieren un aprendizaje autónomo continuo o donde la privacidad es crucial.
El equipo de investigación empleó un paradigma de aprendizaje llamado "aprendizaje federado descentralizado" para su investigación sobre la cadena de bloques. Descubrieron que podían coordinar con éxito los modelos manteniendo al mismo tiempo la descentralización de los datos. La mayor parte de su investigación se centró en estudiar la resistencia del enjambre frente a diversos métodos de ataque. Debido a la naturaleza descentralizada de la tecnología de la cadena de bloques y a la red de entrenamiento, el equipo demostró solidez frente a los ataques de piratería tradicionales.
Sin embargo, los investigadores identificaron un umbral para la cantidad de robots maliciosos que el enjambre podría controlar. Desarrollaron escenarios con robots diseñados para dañar la red, incluidos agentes con agendas nefastas, información obsoleta e instrucciones simples para interrumpir el funcionamiento. Si bien era relativamente fácil defenderse de los agentes simples y obsoletos, los agentes inteligentes con intenciones maliciosas podrían eventualmente interrumpir la inteligencia del enjambre si se infiltraran suficientes en él.
Esta investigación sigue siendo experimental y solo se ha llevado a cabo mediante simulaciones. Sin embargo, puede llegar un momento en que los enjambres de robots puedan coordinarse de manera descentralizada, lo que podría permitir que agentes de IA de diferentes empresas o países colaboren en el entrenamiento de un agente más grande sin comprometer la privacidad de los datos.