OpenAI lanzó un nuevo modelo de razonamiento o3, estableciendo un récord con un impresionante 75.7% en la prueba ARC-AGI, e introdujo la tecnología de "alineación deliberativa" para mejorar la seguridad del modelo. Este modelo actualmente está abierto para solicitudes de pruebas de seguridad y se espera que se lance oficialmente a principios de 2025. (Resumen: ¡La herramienta de generación de videos de OpenAI, Sora, ya está en línea! 5 puntos destacados de sus funciones y planes de suscripción en un vistazo) (Información adicional: OpenAI presentó la versión completa del modelo o1 y un nuevo plan de suscripción ChatGPT Pro, ¿vale la pena los 200 dólares al mes?) El desarrollador detrás de ChatGPT, OpenAI, concluyó ayer (20) su presentación de nuevos productos después de 12 días consecutivos, destacando el nuevo modelo de razonamiento "o3" y "o3-mini", que cuenta con habilidades de razonamiento más fuertes y está diseñado para abordar tareas complejas que requieren razonamiento lógico paso a paso. Hoy compartimos evaluaciones de una versión temprana del próximo modelo en nuestra serie de razonamiento o-model: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 de diciembre de 2024 Características del modelo 1) Capacidades de razonamiento establecen un récord SoTA OpenAI declaró que el modelo o3 se desempeñó excepcionalmente en múltiples pruebas de referencia, incluidas problemas complejos de programación, matemáticas y ciencias, demostrando su poderosa capacidad de razonamiento lógico. En la evaluación "ARC-AGI" desarrollada por el Alignment Research Center (ARC), que prueba las capacidades de inteligencia artificial general (AGI), o3 logró un impresionante 75.7% en algunas pruebas no públicas, estableciendo una nueva altura técnica (Estado del Arte, SoTA). Además, una versión de alta configuración de cómputo de o3 alcanzó un 87.5% en la misma prueba, pero puede que no haya calificado para ARC-AGI-Pub (resultados de pruebas ARC-AGI verificables públicamente) debido a que los requisitos de recursos de esa versión superan los estándares. ¡Nuevo SoTA verificado de ARC-AGI-Pub! @OpenAI o3 ha obtenido un impresionante 75.7% en la Evaluación Semi-Privada de ARC-AGI. Y una configuración de o3 de alta computación (no elegible para ARC-AGI-Pub) obtuvo un 87.5% en la Evaluación Semi-Privada. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20 de diciembre de 2024 2) Opciones de múltiples versiones OpenAI ofrece dos versiones, o3 y o3-mini, esta última se espera que se lance a finales de enero de 2025, mientras que la versión completa de o3 se lanzará después (sin fecha específica anunciada). Este nuevo modelo utiliza la API de Tiempo de Pensamiento Adaptativo (Adaptive Thinking Time) recientemente lanzada por OpenAI, que proporciona tres modos de razonamiento: bajo, medio y alto. Esta función permite a los usuarios ajustar la duración del "tiempo de pensamiento" del modelo antes de responder preguntas según sus necesidades. Como se puede ver en la imagen de abajo, o3-mini puede igualar los resultados de razonamiento del actual modelo o1, pero reduce significativamente los costos computacionales. 3) Mejora de la seguridad OpenAI ha adoptado un nuevo método de entrenamiento de "alineación deliberativa", que enseña directamente a los modelos de lenguaje grande (LLMs) a comprender las normas de seguridad redactadas por humanos que son explicables y a asegurar el cumplimiento de estas normas antes de razonar para responder preguntas. OpenAI declaró: A través de este método, hemos optimizado con éxito los modelos de la serie o de OpenAI, permitiéndoles utilizar la técnica de razonamiento de "cadena de pensamiento" (Chain-of-Thought, CoT) para reflexionar sobre las preguntas de los usuarios, identificar los textos normativos relevantes en las políticas internas de OpenAI y generar respuestas más seguras. Origen del nombre Es notable que OpenAI omitió el nombre "o2" y utilizó directamente "o3". El CEO Sam Altman explicó que esto fue para evitar confusiones con el proveedor de telecomunicaciones británico O2, al mismo tiempo que mostró el único sentido del humor de OpenAI. Dijo en una transmisión en vivo: "Por respeto a Telefónica (la empresa matriz de O2) y para continuar la excelente tradición de OpenAI de ser muy malos para nombrar, lo llamamos o3." Invitación a los investigadores para participar en pruebas de seguridad Actualmente, o3 y o3-mini están en fase de pruebas de seguridad internas, y OpenAI ha abierto solicitudes, invitando a investigadores externos a participar en las pruebas de seguridad. Las solicitudes se cerrarán el 10 de enero de 2025. Sobre el lanzamiento de este modelo, Sam Altman no fue modesto al afirmar que esto marca el comienzo de la "próxima etapa" en el desarrollo de IA. Recordando que a mediados de este año Bloomberg filtró el sistema de clasificación de IA de OpenAI, la siguiente etapa después de los chatbots y los modelos de razonamiento son los Agentes: sistemas avanzados de IA que pueden actuar en nombre de los usuarios. Este es precisamente el enfoque clave que actualmente se está explorando y desarrollando en los mercados de criptomonedas y en el ámbito de Web2. Sistema de clasificación de IA de OpenAI. Fuente de la imagen: Bloomberg Reportes relacionados OpenAI presenta la nueva función de "ajuste fino de aprendizaje reforzado", mejorando la precisión del aprendizaje en campos especializados de IA. OpenAI anunció que transmitirá en vivo durante 12 días: lanzando muchas nuevas funciones, ¿podría haber monedas conceptuales de IA en juego? OpenAI pierde la batalla política, ¿Sam Altman podrá competir con la "alianza de IA" de Musk y Trump? "¡OpenAI lanza el modelo o3! Las capacidades de razonamiento elevan el nivel, abriendo el camino para la próxima generación de IA" este artículo fue publicado por primera vez en BlockTempo (el medio de noticias de blockchain más influyente).