Inspirador:

En la madrugada del 14 de mayo de 2024, OpenAI celebró su primer "Lanzamiento de nuevos productos de primavera". Lanzaron un nuevo producto estrella: el modelo de generación GPT-4o y la aplicación de escritorio, y demostraron algunas características nuevas.

Esta conferencia es inusual porque la tecnología OpenAI cambia la forma del producto que conocemos y transmite un mensaje importante a las empresas tecnológicas globales.

Mientras que otras empresas de tecnología todavía se están poniendo al día con modelos grandes y funciones multimodales, tratando de integrar textos resumidos, edición de imágenes y otras funciones en aplicaciones móviles, OpenAI ha desencadenado directamente una gran ola de revolución tecnológica. Los productos que están lanzando parecen sacados directamente de una película de ciencia ficción, ¡y Ultraman Sam está cautivado por ellos!

Introduce el texto: 👇

La directora técnica de OpenAI, Mira Murati, expresó tres cosas importantes:

●Primero, anunció que los futuros productos de OpenAI darán prioridad al uso gratuito para que más personas puedan beneficiarse.

●En segundo lugar, para lograr este objetivo, OpenAI ha lanzado una versión de escritorio del programa y una interfaz de usuario (UI) actualizada que hace que el uso de estas herramientas sea más fácil y natural.

●Finalmente, después de que Mira anunciara GPT-4, OpenAI lanzó una nueva versión del modelo grande llamado GPT-4o. Lo especial de este nuevo modelo es que interactúa con los usuarios de una manera extremadamente natural, brindando inteligencia comparable a GPT-4 para todos, e incluso los usuarios gratuitos pueden disfrutar de este nivel de servicio.

Después de esta actualización de ChatGPT, el modelo grande puede recibir cualquier combinación de texto, audio e imágenes como entrada y generar cualquier combinación de salida de texto, audio e imágenes en tiempo real; este es el método de interacción del futuro.

Cuatro aspectos destacados de GPT-4o:

Punto culminante 1: Diálogo realista + solución matemática

La velocidad de respuesta de GPT-4o es bastante rápida, con un promedio de solo 320 milisegundos, y lo más rápido que puede responder a su pregunta es en solo 232 milisegundos, que es aproximadamente la misma velocidad que una conversación humana. Esto significa que cuando hable con GPT-4o, no tendrá que esperar demasiado para obtener una respuesta inmediata. Además, después de que la velocidad de respuesta de GPT-4o se vuelve más rápida, su interacción contigo se vuelve más natural, ¡un poco como charlar con una persona real! ¡Incluso puede imitar el tono del robot, contarte cuentos antes de dormir e incluso cantar!

No solo eso, GPT-4o también mejora la tecnología de visualización a través de la cámara, ¡puede ayudarte a resolver problemas matemáticos paso a paso! Esto significa que aprender matemáticas se vuelve más divertido y más fácil de entender.

Punto culminante 2: Una nueva era de comunicación inteligente

Esta vez, la tecnología de voz de GPT-4o se ha mejorado no solo en la velocidad de respuesta y la percepción de emociones, sino también en la función de traducción de idiomas en tiempo real. En la rueda de prensa hablaron en italiano e inglés respectivamente. Luego, GPT-4o pudo traducir rápidamente su conversación al idioma de la otra persona, demostrando sus poderosas capacidades de traducción sobre la marcha.

Punto culminante 3: una nueva era de detección inteligente de las emociones del usuario

En el pasado, modelos como GPT-3.5 y GPT-4 se construían a partir de tres partes separadas que eran responsables de convertir audio en texto, procesar texto y luego convertir texto en audio. Este proceso es un poco engorroso y este diseño impide que GPT capture con precisión detalles como el tono y la emoción.

Sin embargo, OpenAI ha realizado ajustes especiales en el modelo GPT-4o. Ahora, tanto la entrada como la salida son procesadas por la misma red neuronal, lo que permite una mejor detección de las emociones del usuario. Incluso si hay una pausa en la conversación, GPT-4o puede reanudarla y continuarla rápidamente.

Resalte 4: Gratis para todos los usuarios

El modelo GPT-4o estará abierto a todos los usuarios de forma gratuita, mientras que el límite de capacidad para los usuarios de pago se incrementará cinco veces. La próxima versión alfa de GPT-4o incluirá un nuevo modo de voz para los usuarios de ChatGPT Plus. La "Tienda GPT", que anteriormente solo estaba disponible para los usuarios de ChatGPT Plus, ahora es gratuita y está abierta a todos los usuarios. Además, los usuarios de Mac ahora pueden usar la versión de escritorio de la aplicación ChatGPT, mientras que este año también se lanzará una versión para usuarios de Windows.

Estas actualizaciones significan que más personas pueden disfrutar de las potentes funciones de GPT-4o, y la "Tienda GPT" gratuita y abierta también ofrece a los usuarios más opciones.

Sobre lo que viene con OpenAI:

Además de presentar el nuevo modelo, OpenAI también reveló su estrategia comercial en la conferencia de prensa.

Primero, afirmaron que el costo de consulta del nuevo modelo es un 50% menor que el de GPT-4, lo que significa que tienen la capacidad de proporcionar el nuevo modelo a todos los usuarios. Esto sugiere que OpenAI está más centrado en atraer una gran cantidad de usuarios que en conseguir que más personas paguen para suscribirse.

La gran cantidad de usuarios es una buena noticia para la tienda GPT, que lleva varios meses online. Al igual que la tienda iOS, OpenAI espera que la comunidad de creadores y los desarrolladores puedan promover conjuntamente el desarrollo de las tiendas GPT.

Por ejemplo, algunos profesores pueden utilizar GPT para diseñar contenido personalizado para sus clases, o los podcasters pueden producir contenido GPT exclusivo para los oyentes. Por supuesto, algunos tecnólogos también creen que en el futuro aparecerán en los teléfonos inteligentes muchas herramientas útiles impulsadas por GPT-4o.

Actualmente, Apple está buscando socios externos a este respecto, y los socios negociadores incluyen a Google y OpenAI.

¿Qué es lo que más necesita OpenAI? Solo Apple puede proporcionar permisos de aplicaciones del lado del dispositivo y permisos a nivel del sistema.

¿Qué es lo que más necesita Apple? GPT-4o, la mejor tecnología de inteligencia artificial y el modelo de lenguaje grande más adecuado, es sin duda el mejor candidato.

Además, Apple tiene ventajas únicas en chips de desarrollo propio y ecosistema cerrado. Mientras escribo esto, incluso comienzo a esperar con ansias la próxima conferencia WWDC de Apple el 10 de junio.

fin:

En el campo de la inteligencia artificial, cada avance tecnológico representa una integración más profunda de la inteligencia humana y la inteligencia artificial. Como último modelo insignia de OpenAI, GPT-4o ha logrado grandes avances en tecnología. Agrega capacidades de comprensión de audio y presta más atención a la experiencia del usuario, lo que hace que la interacción sea más natural y conveniente.

Aunque OpenAI todavía enfrenta muchas oportunidades y desafíos, la compañía ha mantenido una firme convicción y una innovación continua. En el futuro campo de la inteligencia artificial, OpenAI seguirá desempeñando un papel de liderazgo y haciendo mayores contribuciones al progreso de la sociedad humana.