OpenAI en el lanzamiento del nuevo producto en el Día 2 presentó la función "Ajuste Fino por Refuerzo" (Reinforcement Fine-Tuning, RFT), que permite a los usuarios mejorar la capacidad de razonamiento de modelos personalizados en campos específicos, aumentando así la precisión del modelo. Esta función se puede aplicar en muchos campos, incluyendo investigación científica, derecho, finanzas, seguros, ingeniería, entre otros. (Resumen: OpenAI lanzó la versión completa del modelo o1 y el nuevo plan de suscripción ChatGPT Pro, ¿vale la pena la tarifa mensual de 200 dólares?) (Contexto adicional: OpenAI anunció una transmisión en vivo de 12 días: ¿se pueden encontrar monedas conceptuales de IA?) El desarrollador detrás de ChatGPT, OpenAI, anunció el día 5 que comenzaría un lanzamiento de nuevos productos de 12 días a las 2 a.m. del día 6. El primer día se presentó el modelo de razonamiento completo o1, reemplazando la versión previa. Actualmente, los usuarios de ChatGPT Plus, Team y Pro pueden utilizarla, y también se lanzó un plan de suscripción que permite el uso ilimitado del modelo o1: "ChatGPT Pro". Lectura adicional: OpenAI lanzó la versión completa del modelo o1 y el nuevo plan de suscripción ChatGPT Pro, ¿vale la pena la tarifa mensual de 200 dólares? Hoy (día 7) es el Día 2 del evento, ¿qué sorpresas ha preparado OpenAI para nosotros? Lanzamiento de la nueva función "Ajuste Fino por Refuerzo" En el lanzamiento del producto del segundo día, OpenAI presentó la nueva función "Ajuste Fino por Refuerzo" (Reinforcement Fine-Tuning, RFT), que permite a los usuarios utilizar sus propios conjuntos de datos para entrenar personalizadamente el modelo o1 mediante algoritmos de aprendizaje por refuerzo. Además, el presentador del evento indicó que el ajuste fino por refuerzo solo requiere unas pocas decenas de ejemplos de alta calidad para mejorar rápidamente la capacidad de razonamiento del modelo en un campo específico. Es importante mencionar que esta función se puede aplicar en muchos campos, incluyendo investigación científica, derecho, finanzas, seguros, ingeniería, entre otros. Además, en el video de lanzamiento, Justin Reese, biólogo computacional del Laboratorio Nacional de Berkeley, también participó en la demostración en vivo del modelo, compartiendo cómo el "Ajuste Fino por Refuerzo" ayuda en el diagnóstico de enfermedades raras. En las imágenes mostradas por Reese, se puede ver que la tasa de precisión original del modelo o1 era del 25 %; la tasa de precisión original del modelo o1 mini era del 17 %, y después del ajuste fino por refuerzo, la tasa de precisión del modelo o1 mini aumentó al 31 %, logrando un incremento del 82 %. Aunque la función de "Ajuste Fino por Refuerzo" mejora significativamente la precisión y especialización del modelo en campos específicos, el presentador también mencionó que actualmente la función de ajuste fino por refuerzo aún se encuentra en fase de vista previa, con planes de lanzarla al público el próximo año. Además, OpenAI ha iniciado el programa alpha de RFT, invitando a universidades, instituciones de investigación o empresas a participar en las pruebas de esta función. Reportes relacionados: ChatGPT es acusado de "negarse a responder a David Mayer" y otros nombres, OpenAI es sospechoso de bloquear información intencionalmente. OpenAI anunció una transmisión en vivo de 12 días: ¿se pueden encontrar monedas conceptuales de IA? OpenAI lanzó la versión completa del modelo o1 y el nuevo plan de suscripción ChatGPT Pro, ¿vale la pena la tarifa mensual de 200 dólares? "OpenAI lanza en el Día 2 la sorprendente nueva función de "Ajuste Fino por Refuerzo", mejorando la precisión del aprendizaje en campos especializados de IA" este artículo fue publicado originalmente en BlockTempo (BlockTempo - el medio de noticias de blockchain más influyente).