Microsoft ha presentado Phi-4, la última iteración en su serie Phi de modelos de inteligencia artificial generativa (IA). La arquitectura optimizada incorpora avances en la resolución de problemas matemáticos.
Según los informes, el nuevo modelo, que cuenta con 14 mil millones de parámetros, tiene como objetivo competir con otros modelos de IA compactos como GPT-4o Mini, Gemini 2.0 Flash y Claude 3.5 Haiku.
Según el blog de Microsoft, Phi-4 está disponible con acceso limitado a través de la plataforma Azure AI Foundry de Microsoft y está restringido a fines de investigación bajo un acuerdo de licencia de investigación de Microsoft.
Phi-4: Rendimiento mejorado en razonamiento matemático
Microsoft ha posicionado a Phi-4 como un líder en la resolución de problemas matemáticos, citando ganancias de rendimiento sustanciales sobre sus predecesores y modelos comparables. La compañía tiene confianza en las capacidades del modelo de IA después de que Phi-4 supuestamente lograra las mejores calificaciones en varios puntos de referencia estandarizados.
Fuente: Microsoft
En la prueba GPQA, obtuvo 56.1, superando el 40.9 de GPT-4o y el 49.1 de Llama-3. En el punto de referencia MATH, Phi-4 logró 80.4, reflejando sus capacidades avanzadas para abordar problemas matemáticos complejos. También destacó en los puntos de referencia de codificación, logrando una puntuación de 82.6 en HumanEval.
Además, Phi-4 demostró su destreza en escenarios del mundo real, incluyendo altas puntuaciones en problemas de las Competencias Matemáticas Americanas (AMC-10/12) de la Asociación Matemática de América. Estos resultados indican aplicaciones potenciales en investigación científica, ingeniería y modelado financiero, campos donde la precisión matemática y el razonamiento son críticos.
Fuente: Microsoft
Mientras que modelos más grandes como GPT-4o de OpenAI y Gemini Ultra de Google operan con cientos de miles de millones o incluso billones de parámetros, Phi-4 demuestra que arquitecturas más pequeñas y optimizadas pueden lograr un rendimiento superior en tareas especializadas.
Microsoft atribuye los avances de Phi-4 a la integración de datos sintéticos de alta calidad junto con conjuntos de datos de contenido generado por humanos, así como mejoras no divulgadas realizadas durante el post-entrenamiento. Estos esfuerzos reflejan una tendencia más amplia en la industria de la IA, donde los equipos de investigación se enfocan cada vez más en innovaciones en el uso de datos sintéticos y optimización post-entrenamiento.
El CEO de Scale AI, Alexandr Wang, destacó recientemente este cambio, comentando que la industria ha alcanzado una "pared de datos de preentrenamiento", añadiendo que las empresas ahora competirán por desarrollar modelos de IA más eficientes.
El cómputo importa, pero también los datos, y hemos alcanzado una pared de datos de preentrenamiento. Prepárate para el auge de datos post-entrenamiento. Las empresas competirán por tener los mejores datos de frontera: multimodal, agentic, razonamiento complejo y más. Sigue los datos, encuentra a los ganadores. 7/8
— Alexandr Wang (@alexandr_wang) 12 de diciembre de 2024
IA responsable y características de seguridad
Microsoft continúa enfatizando el desarrollo responsable de soluciones de IA, incorporando medidas de seguridad robustas en Phi-4 y sus predecesores. A través de Azure AI Foundry, los usuarios obtienen acceso a herramientas diseñadas para evaluar y mitigar riesgos a lo largo del ciclo de vida del desarrollo de IA.
Estas herramientas incluyen escudos de solicitud, que protegen contra entradas inapropiadas o dañinas, detección de material protegido para identificar contenido sensible en salidas, y detección de fundamentación para asegurar que las salidas sean factualmente precisas y relevantes.
Además, hay características integradas en el conjunto de herramientas de Seguridad de Contenido de Azure AI, que permiten a los desarrolladores aplicar filtros y monitorear aplicaciones por calidad, seguridad e integridad de datos. Las alertas en tiempo real proporcionan intervenciones oportunas para abordar problemas como solicitudes adversariales y desviaciones de contenido.
Azure AI Foundry apoya aún más las evaluaciones iterativas de modelos con métricas tanto integradas como personalizadas, brindando a los desarrolladores la flexibilidad para ajustar sus aplicaciones de IA para un rendimiento óptimo.
Un sistema paso a paso para lanzar tu carrera en Web3 y conseguir trabajos bien remunerados en criptomonedas en 90 días.