El gigante de los motores de búsqueda Google lanzó el miércoles su Gemini 2.0, un modelo experimental que puede usar sitios web por su cuenta y es básicamente un modelo “para todo.”
Según el CEO de Google, Sundar Pichai, el último modelo permitirá a los usuarios construir nuevos agentes de IA que “nos acerquen a nuestra visión de un asistente universal.” La empresa ha descrito su modelo como su “modelo más capaz construido hasta ahora para la era agentiva.”
Las iniciativas forman parte de los esfuerzos de la firma en la competencia aumentada de la industria tecnológica contra gigantes como Meta, Microsoft y Meta.
Google implementará el modelo en todos los productos
Pichai también reveló que el último modelo, con capacidades multimodales, se implementará en sus productos, incluyendo salida de imagen y audio nativos. El gigante de los motores de búsqueda lanzó Gemini 1.0 en diciembre del año pasado, que Google dijo que era el primer modelo “nativamente multimodal”, sugiriendo que el modelo podría procesar y responder a consultas de texto, video, imagen, audio y código.
La última versión representa los últimos esfuerzos de Google en la cada vez más competitiva carrera de IA en la industria tecnológica.
“Si Gemini 1.0 se trataba de organizar y entender información, Gemini 2.0 se trata de hacerla mucho más útil.”
Pichai.
Gemini 2.0 llega casi 10 meses después de que Google lanzara por primera vez 1.5. El modelo aún está en vista experimental, según Google, con solo una versión del modelo, el más pequeño y de gama baja 2.0 Flash lanzado.
El CEO de Google DeepMind y jefe de los esfuerzos de IA de la empresa, Demis Hassabis, dijo que este aún era un gran día para el gigante tecnológico.
“Es tan bueno como el actual modelo Pro. Así que puedes pensar en ello como un nivel completo mejor, por la misma eficiencia de costo y eficiencia de rendimiento y velocidad. Estamos realmente contentos con eso,” explicó Hassabis.
Actualmente, solo los desarrolladores y testers son los primeros en obtener 2.0, mientras que otros usuarios de Gemini tienen acceso al modelo experimental 2.0 Flash, que se basa en 1.5 Flash, que fue lanzado como el modelo más rápido y rentable.
Google anunció una serie de nuevas características
Según la empresa, espera añadir las capacidades de razonamiento del nuevo modelo a la función de Resúmenes de IA, que ahora es accesible para mil millones de usuarios, según Pichai. Él ha indicado que se está convirtiendo en una de las características de búsqueda más populares del grupo.
Con este nuevo modelo, Pichai destacó aún más que los Resúmenes de IA ahora podrán abordar consultas complejas de múltiples pasos, por ejemplo, ecuaciones matemáticas y preguntas multimodales.
Mientras las pruebas limitadas para el modelo más nuevo comenzaron esta semana, la característica de razonamiento solo será accesible para más usuarios a principios del próximo año.
Según Google, el modelo de razonamiento funciona con el chip de IA de sexta generación de la gigante de los motores de búsqueda, Trillium, que también se volvió disponible para los clientes de Google Cloud el miércoles.
En su publicación de blog, Google reveló que el nuevo chip ofrece un rendimiento 4 veces mejor y es un 67% más eficiente energéticamente que su predecesor.
Estamos comenzando la era de Gemini 2.0 con Gemini 2.0 Flash, que supera a 1.5 Pro en puntos de referencia clave a 2X velocidad (ver gráfico a continuación). Estoy especialmente emocionado de ver el rápido progreso en codificación, con más por venir.
Los desarrolladores pueden probar una versión experimental en IA… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 11 de diciembre de 2024
El CEO de Google también anunció otras características, como la nueva función de Gemini conocida como Investigación Profunda, que puede actuar como un asistente de investigación utilizando capacidades avanzadas de razonamiento y contexto largo. Esta nueva función está disponible en Gemini Avanzado y es capaz de compilar informes de investigación en nombre de un usuario.
Hassabis dijo que Gemini 2.0 estaba sentando las bases para un gran 2025.
“Realmente vemos 2025 como el verdadero inicio de la era basada en agentes.”
Hassabis.
Esto ocurre cuando la empresa anunció el lanzamiento de otro producto, Project Mariner, una nueva extensión experimental de Chrome que puede usar literalmente un navegador web para los usuarios.
Además, Google también anunció que Jules - un agente creado específicamente para ayudar a los desarrolladores a encontrar y corregir código defectuoso- y un nuevo agente basado en Gemini 2.0 que puede mirar las pantallas de los usuarios y ayudarles a jugar videojuegos mejor.
Según Hassabis, el agente del juego que él llama un “huevo de pascua” indica que es verdaderamente multimodal.
De Cero a Web3 Pro: Tu Plan de Lanzamiento Profesional de 90 Días