Synthesia, une startup d'intelligence artificielle (IA) soutenue par Nvidia, a introduit une nouvelle mise à niveau permettant aux avatars IA de transmettre les émotions et les mouvements humains.

Le 25 avril, la société a dévoilé ses « Avatars expressifs », qui visent à exprimer des émotions sur la base d'instructions textuelles à des fins de présentations d'entreprise, de marketing et de formation.

Ça y est. Cela change tout. Pour la première fois dans l'histoire, les#AIavatarssont capables de comprendre ce qu'ils disent. Propulsés par notre nouveau modèle d'avatar IA, EXPRESS-1, ils peuvent détecter le sentiment d'un script et exécuter toutes les nuances subtiles de la communication humaine. Le… pic.twitter.com/uj3WIjcGlm

– Synthesia (@synthesiaIO) 25 avril 2024

Alors que l’IA générative a souvent été louée pour sa capacité à créer des images animées réalistes, c’est le cas du générateur vidéo Sora d’OpenAI.

Cependant, l’IA n’est pas sans défauts, en particulier lorsqu’il s’agit de représenter des humains, qui sont souvent représentés avec des mains ou des membres déformés, des arrière-plans collés ou des lèvres désynchronisées avec la parole.

Synthesia vise à corriger ce problème dans sa dernière version, qui a été développée sur de vrais humains lisant des scripts dans leur studio. Cela a été fait pour aider les robots à capturer le suivi des lèvres et à être plus précis dans leurs expressions émotionnelles.

Victor Ribarbelli, PDG et co-fondateur de Synthesia, a déclaré dans une vidéo que la pièce manquante était que, contrairement aux humains, "les avatars ne comprennent pas ce qu'ils disent", ce qui entraînait auparavant un manque de réponse faciale aux émotions. .

En studio, ils ont été formés à répondre à des invites simples telles que : « Je suis heureux. Je suis triste. Je suis frustré » en transmettant les expressions faciales et le ton corrects associés à l'émotion donnée.

Source : Synthésie

Les nouveaux avatars sont également disponibles dans plus de 130 langues, peuvent fournir leurs propres sous-titres et même cloner les propres voix des utilisateurs.

Connexes : Sam Altman pousse l'adoption massive de ChatGPT parmi les entreprises Fortune 500 : rapport

Cependant, parmi les exemples de modèles d'avatars sur le site Web de Synthesia parlant dans des langues autres que l'anglais telles que le français, l'allemand et l'espagnol, le modèle de langue anglaise est le plus avancé et le plus humain, selon un test Cointelegraph du modèle.

La startup compterait au moins la moitié des sociétés Fortune 100 parmi ses clients et fournirait des services à plus de 55 000 entreprises. Cela inclut des leaders de divers secteurs tels que Zoom, Xerox, Microsoft et Reuters, entre autres.

Synthesia est une société basée au Royaume-Uni fondée en 2017. Dans la foulée du boom de l'IA au cours de l'année dernière, elle a atteint une valorisation de près d'un milliard de dollars avec des bailleurs de fonds majeurs comme Nvidia – qui domine actuellement le développement des puces à semi-conducteurs pour l'IA.

En raison de son approche plus restreinte – créer des avatars ressemblant à des humains à des fins professionnelles – Synthesia a évité une partie du battage médiatique et de la concurrence féroce observée entre les modèles de chatbot concurrents comme ChatGPT d’OpenAI et le chatbot Gemini de Google.

Magazine : Comment obtenir de meilleures prédictions cryptographiques à partir de ChatGPT, la broche Humane AI critiquée : AI Eye