Synthesia, una startup de inteligencia artificial (IA) respaldada por Nvidia, ha introducido una nueva actualización que permite a los avatares de IA transmitir emociones y movimientos humanos.

El 25 de abril, la compañía reveló sus “Avatares expresivos”, cuyo objetivo es expresar emociones basadas en instrucciones de texto para presentaciones corporativas, marketing y capacitación.

Eso es todo. Esto lo cambia todo. Por primera vez en la historia, los#AIavatarsson capaces de entender lo que están diciendo. Gracias a nuestro nuevo modelo de avatar de IA, EXPRESS-1, pueden detectar el sentimiento de un guión y realizar todos los matices sutiles de la comunicación humana.... pic.twitter.com/uj3WIjcGlm

– Síntesis (@synthesiaIO) 25 de abril de 2024

Si bien la IA generativa ha sido a menudo elogiada por su capacidad para crear imágenes en movimiento realistas, tal es el caso del generador de vídeo Sora de OpenAI.

Sin embargo, la IA no está exenta de defectos, especialmente cuando retrata a humanos, que a menudo se muestran con manos o extremidades distorsionadas, fondos en collage o labios no sincronizados con el habla.

Synthesia pretende corregir esto en su última versión, que se desarrolló con humanos reales leyendo guiones en su estudio. Esto se hizo para ayudar a los robots a capturar el seguimiento de los labios y ser más precisos en sus expresiones emotivas.

Victor Ribarbelli, director ejecutivo y cofundador de Synthesia, dijo en un vídeo que la pieza que faltaba era que, a diferencia de los humanos, "los avatares no entienden lo que dicen", lo que anteriormente conducía a la falta de respuesta facial a las emociones. .

En el estudio, fueron entrenados para responder a indicaciones simples como: “Estoy feliz. Estoy triste. Estoy frustrado” al transmitir las expresiones faciales correctas y el tono asociado con la emoción dada.

Fuente: Síntesis

Los nuevos avatares también están disponibles en más de 130 idiomas, pueden proporcionar sus propios subtítulos e incluso clonar las propias voces de los usuarios.

Relacionado: Sam Altman impulsa la adopción masiva de ChatGPT entre las empresas Fortune 500: Informe

Sin embargo, entre los modelos de ejemplo de avatares en el sitio web de Synthesia que hablan otros idiomas además del inglés, como francés, alemán y español, el modelo de idioma inglés es el más avanzado y parecido a un humano, según una prueba del modelo por parte de Cointelegraph.

Según se informa, la startup tiene al menos la mitad de las empresas Fortune 100 incluidas como clientes y proporciona servicios a más de 55.000 empresas. Esto incluye líderes en diversas industrias como Zoom, Xerox, Microsoft y Reuters, entre otras.

Synthesia es una empresa con sede en el Reino Unido fundada en 2017. Tras el auge de la IA durante el último año, ha alcanzado una valoración de casi mil millones de dólares con importantes patrocinadores como Nvidia, que actualmente domina el desarrollo de chips semiconductores de IA.

Debido a su enfoque más limitado (crear avatares con apariencia humana para uso empresarial), Synthesia ha estado evitando parte del revuelo y la feroz competencia observada entre modelos de chatbot competidores como ChatGPT de OpenAI y el chatbot Gemini de Google.

Revista: Cómo obtener mejores predicciones criptográficas de ChatGPT, PIN de Humane AI cerrado de golpe: AI Eye