Ilya Sutskever, cofundador de OpenAI, señaló el 15 de diciembre en la conferencia de sistemas de procesamiento de información neuronal (NeurIPS) en Vancouver, Canadá, que el desarrollo de la IA ha llegado a un punto de inflexión crítico, con las técnicas de preentrenamiento enfrentando un estancamiento gradual, y que en el futuro se avanzará hacia la superinteligencia artificial (ASI).
Los datos de preentrenamiento de IA se encuentran con un "techo", la transformación es inminente.
Sutskever declaró en la conferencia que la era del preentrenamiento de la IA está a punto de concluir. Considera que la cantidad de datos en línea se acerca a su límite, y que en el futuro se necesitarán nuevas tecnologías para seguir avanzando la IA hacia la siguiente etapa, culminando en el desarrollo de la superinteligencia artificial (ASI).
Sutskever mencionó que, a medida que el hardware, el software y los algoritmos continúan avanzando, la capacidad de cálculo de la IA ha mejorado considerablemente, pero los datos utilizados para entrenar la IA no pueden expandirse indefinidamente. Sutskever comparó los datos con el "combustible fósil" de la IA, afirmando: "Los datos no crecerán indefinidamente porque solo hay una red. Los datos son como el combustible fósil de la IA, y ya están casi agotados, en el futuro debemos encontrar formas de aprovechar al máximo los datos existentes."
(Nota: un modelo de preentrenamiento se refiere a un modelo que no comienza desde cero, sino que ya ha aprendido conocimientos básicos.)
Tres tecnologías clave para avanzar en el desarrollo de la IA.
Aunque Sutskever señaló en la conferencia los problemas actuales de la IA, también presentó las tres tecnologías clave que pueden influir en la evolución de la IA hacia la superinteligencia artificial (ASI):
IA autónoma (Agentic AI): puede tomar decisiones y ejecutar tareas por sí misma sin intervención humana, capaz de ajustar su comportamiento dinámicamente según los objetivos y el entorno. A diferencia de los agentes de IA, que principalmente actúan de manera pasiva o según una lógica fija, requieren más intervención humana.
Datos sintéticos (Synthetic Data): utiliza IA para generar de forma autónoma datos simulados de alta calidad, resolviendo el problema de la cantidad insuficiente de datos. Por ejemplo, si se desea entrenar un modelo de IA para reconocer vehículos en la carretera, pero los datos de tráfico del mundo real son insuficientes, podemos utilizar técnicas sintéticas para "generar" muchos vehículos y escenarios simulados como sustituto.
Cálculo de inferencia en tiempo real (Inference Time Computing): mejora la capacidad de cálculo del modelo de IA, permitiendo que la IA resuelva problemas complejos más rápidamente.
Sutskever cree que estas tres grandes tecnologías pueden avanzar la tecnología de IA actual hacia la "superinteligencia artificial" (ASI).
La ola de IA arrasa el mercado de blockchain y LLM.
El concepto de agentes de IA no solo ha recibido atención en el ámbito tecnológico, sino que muchas criptomonedas y modelos de lenguaje de gran tamaño (LLMs) también han comenzado a integrar tecnología de IA, como el agente de IA Truth Terminal, que promociona la criptomoneda meme GOAT en las redes sociales, cuyo valor de mercado ha alcanzado los 600 millones de dólares, sorprendiendo incluso a Marc Andreessen, cofundador de la reconocida firma de capital de riesgo a16z.
Y el caso más conocido recientemente de agentes de IA que combinan modelos de lenguaje de gran tamaño es el modelo Gemini 2.0 lanzado por Google DeepMind. Según indica Google oficialmente, Gemini 2.0 puede generar imágenes y texto directamente, e incluso convertir texto en voz, además de poder ajustar los efectos de sonido en diferentes idiomas, también puede utilizar Google Search, ejecutar código y usar herramientas de terceros personalizadas por los usuarios.
Ventajas de la IA autónoma, resolviendo el problema de las "alucinaciones" de la IA.
Sutskever señala que la IA autónoma y el cálculo de inferencia en tiempo real ayudan a resolver las "alucinaciones" de la IA (AI Hallucinations) en el entrenamiento de la IA. Las llamadas alucinaciones de IA se refieren a la posibilidad de que los modelos de IA produzcan información errónea o falsa debido a la falta de datos de entrenamiento. A medida que la nueva generación de modelos de IA sigue dependiendo de los datos producidos por modelos antiguos, este problema solo se volverá más grave.
Sutskever indica que, para resolver el problema de las "alucinaciones", la IA autónoma puede fortalecer la capacidad de razonamiento y el cálculo en tiempo real para juzgar eficazmente la veracidad de los datos, mejorando la confiabilidad y el rendimiento de la IA.
Enfrentándose al gran problema de que los datos de entrenamiento de la IA han alcanzado un límite, lo cual causa "alucinaciones", las ideas de Jensen Huang, CEO de Nvidia, no son del todo diferentes. Huang también mencionó previamente este problema en una entrevista y presentó las tres etapas importantes para mejorar las "alucinaciones" en el futuro:
Entrenamiento previo:
En la fase básica de la IA, se absorben masivamente datos del mundo real para "aprender" y "descubrir" diversos conocimientos, pero esto es solo el comienzo, aún no es lo suficientemente profundo.
Entrenamiento posterior:
Esta es la fase de fortalecimiento de la IA, a través de la retroalimentación humana, como cuando los humanos ayudan a calificar. Así como la retroalimentación de la IA misma, utilizando datos sintéticos para simular más situaciones. En este momento se incorporan técnicas como el aprendizaje por refuerzo y el aprendizaje de múltiples trayectorias para ayudar a la IA a concentrarse en mejorar habilidades específicas, permitiéndole entender mejor cómo resolver problemas.
Escalado del tiempo de prueba:
Esta etapa puede entenderse como el momento en que la IA comienza a "pensar". Cuando se enfrenta a problemas complejos, la IA descompone el problema paso a paso, simula repetidamente diferentes soluciones y luego ajusta constantemente para encontrar la mejor respuesta. Jensen Huang cree que si se le da a la IA más "tiempo para pensar", las respuestas que produce pueden ser más precisas o de mayor calidad.
Este artículo marcará el final del preentrenamiento de la IA. El cofundador de OpenAI: la IA autónoma y los datos sintéticos aceleran la llegada de la era de la superinteligencia artificial. Apareció por primera vez en Chain News ABMedia.