Google ha lanzado dos versiones estables de los modelos API de Gemini 1.5 para desarrolladores, prometiendo un mayor rendimiento y menores costos de producción de aplicaciones.

El 24 de septiembre, Google anunció el lanzamiento de las versiones estables de Gemini 1.5 Pro (gemini-1.5-pro-002) y Gemini 1.5 Flash (gemini-1.5-flash-002). En comparación con los modelos 001 anteriores, los nuevos modelos Gemini listos para producción han mostrado mejoras significativas en la generación de código, matemáticas, razonamiento y análisis de video, entre otros.

Descripción de los modelos Google Gemini 1.5 Flash y Pro. Fuente: Google AI for Developers

Gemini 1.5 Pro reduce las barreras financieras para los desarrolladores

Google redujo el precio de su modelo Gemini 1.5 Pro listo para producción en más del 50% y al mismo tiempo afirmó que tenía límites de velocidad tres veces más altos y una latencia más baja que los lanzamientos de modelos experimentales más antiguos.

Fuente: Google DeepMind

Según las notas de lanzamiento de Google, ambos modelos Gemini 1.5 ofrecen importantes mejoras en factualidad y reducen las alucinaciones del modelo, el seguimiento de instrucciones, la comprensión multilingüe en 102 idiomas, la generación de SQL y la comprensión de audio y documentos.

Comparación del rendimiento de las versiones nuevas y antiguas de Gemini 1.5. Fuente: Google for Developers

Google redujo la longitud de resumen de ambos modelos y brindó a los desarrolladores de productos basados ​​en chat opciones para aumentar las capacidades conversacionales de la API.

A partir del 1 de octubre, los precios de la API de Gemini 1.5 Pro en solicitudes de menos de 128 000 tokens se reducirán al 64 % para tokens de entrada, al 52 % para tokens de salida y al 64 % para tokens incrementales almacenados en caché.

“Para que a los desarrolladores les resulte aún más fácil crear con Gemini, aumentamos los límites de velocidad del nivel pago para 1.5 Flash a 2000 RPM y para 1.5 Pro a 1000 RPM, en comparación con 1000 y 360, respectivamente”, se lee en el anuncio.

Nuevos precios para Google Gemini 1.5 Pro. Fuente: Google para desarrolladores

Google lanza la versión experimental de Gemini 1.5 Flash

Google también anunció el lanzamiento de Gemini 1.5 Flash-8B, una versión experimental más pequeña de 1.5 Flash con números de referencia más bajos. Esta actualización incluye mejoras significativas en el rendimiento tanto en casos de uso de texto como multimodales.

Actualmente, todas las versiones están disponibles en Google AI Studio y la API de Gemini.

Mientras tanto, el mayor competidor de inteligencia artificial de Google, OpenAI, ha comenzado a implementar su función “Voz avanzada” para seleccionar usuarios de ChatGPT.

Fuente: OpenAI

El modo de voz avanzado de ChatGPT permite una comunicación más rápida e intuitiva, similar a la humana, con la IA. Como parte de la nueva función, OpenAI presentó cinco nuevas voces, Arbor, Maple, SXol, Spruce y Vale, que se suman a las opciones de voz existentes: Breeze, Juniper, Cove y Ember.

Revista: Lady of Crypto se quedará sin criptomonedas en septiembre de 2025: X Hall of Flame