Odaily Planet Daily News OpenAI anunció el lanzamiento de o1, un modelo de inteligencia artificial con capacidades de razonamiento, cuyo nombre en código interno es "Strawberry". OpenAI o1 puede razonar sobre tareas complejas y resolver problemas que son más difíciles que los modelos científicos, de codificación y matemáticos anteriores. En las pruebas, OpenAI o1 se desempeñó como un estudiante de doctorado en tareas desafiantes de referencia en física, química y biología, y destacó en matemáticas y codificación. En el examen de calificación de la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió solo el 13% de los problemas correctamente, mientras que el modelo de inferencia obtuvo una puntuación del 83% y la capacidad de codificación de OpenAI o1 alcanzó el percentil 89 en la competencia Codeforces. Si bien OpenAI o1, un modelo inicial, aún no tiene muchas de las funciones útiles de ChatGPT, como navegar por la web en busca de información y cargar archivos e imágenes, GPT-4o será más poderoso en el corto plazo. Pero para tareas de razonamiento complejas, esto supone un avance significativo y representa un nuevo nivel de capacidades de inteligencia artificial. Por este motivo el contador se pone a 1 y la serie se denomina OpenAI o1. Los investigadores de atención médica pueden usar o1 para anotar datos de secuenciación celular, los físicos pueden usar o1 para generar fórmulas matemáticas complejas necesarias para la óptica cuántica y los desarrolladores de todos los campos pueden usar o1 para crear y ejecutar flujos de trabajo de varios pasos. OpenAI también lanzó OpenAI o1-mini, un modelo de inferencia rentable. o1-mini sobresale en STEM, especialmente matemáticas y codificación, funcionando casi tan bien como OpenAI o1 en puntos de referencia de evaluación como AIME y Codeforces. OpenAI predice que o1-mini será un modelo más rápido y rentable que es un 80% más barato que o1-preview para aplicaciones que requieren inferencia sin un amplio conocimiento del mundo. Los usuarios de ChatGPT Plus, Team, Enterprise y Edu pueden usar o1-mini como alternativa a o1-preview con límites de velocidad más altos y latencia más baja.