Synthesia, una startup di intelligenza artificiale (AI) supportata da Nvidia, ha introdotto un nuovo aggiornamento che consente agli avatar AI di trasmettere emozioni e movimenti umani.

Il 25 aprile, la società ha rivelato i suoi “Avatar espressivi”, che mirano a esprimere emozioni sulla base di istruzioni testuali per presentazioni aziendali, scopi di marketing e formazione.

Questo è. Questo cambia tutto. Per la prima volta nella storia, gli#AIavatarsono in grado di capire cosa stanno dicendo. Grazie al nostro nuovo modello di avatar AI, EXPRESS-1, possono rilevare il sentimento di una sceneggiatura ed eseguire tutte le sottili sfumature della comunicazione umana. Il... pic.twitter.com/uj3WIjcGlm

— Synthesia (@synthesiaIO) 25 aprile 2024

Sebbene l’intelligenza artificiale generativa sia stata spesso elogiata per la sua capacità di creare immagini in movimento realistiche, è il caso del generatore video Sora di OpenAI.

Tuttavia, l’intelligenza artificiale non è priva di difetti, soprattutto quando si ritraggono esseri umani, che vengono spesso mostrati con mani o arti distorti, sfondi collage o labbra non sincronizzate con la parola.

Synthesia mira a correggere questo problema nella sua ultima versione, sviluppata su esseri umani reali che leggono sceneggiature nel loro studio. Ciò è stato fatto per aiutare i robot a catturare il tracciamento delle labbra ed essere più accurati nelle loro espressioni emotive.

Victor Ribarbelli, CEO e co-fondatore di Synthesia, ha affermato in un video che il pezzo mancante è che, a differenza degli umani, "gli avatar non capiscono quello che dicono", il che in precedenza portava alla mancanza di risposta facciale alle emozioni .

Nello studio, sono stati addestrati a rispondere a semplici suggerimenti come: “Sono felice. Sono triste. Sono frustrato” trasmettendo le espressioni facciali e il tono corretti associati all'emozione data.

Fonte: Sintesi

I nuovi avatar sono inoltre disponibili in più di 130 lingue, possono fornire i propri sottotitoli e persino clonare le voci degli utenti.

Correlato: Sam Altman promuove l'adozione di massa di ChatGPT tra le aziende Fortune 500: rapporto

Tuttavia, tra i modelli di esempio di avatar sul sito Web di Synthesia che parlano in lingue diverse dall'inglese come francese, tedesco e spagnolo, il modello in lingua inglese è il più avanzato e simile a quello umano, secondo un test del modello effettuato da Cointelegraph.

Secondo quanto riferito, la startup ha almeno la metà delle aziende Fortune 100 elencate come clienti e fornisce servizi a oltre 55.000 imprese. Ciò include leader in vari settori come Zoom, Xerox, Microsoft e Reuters, tra gli altri.

Synthesia è una società con sede nel Regno Unito fondata nel 2017. Sulla scia del boom dell'intelligenza artificiale nell'ultimo anno, ha raggiunto una valutazione di quasi 1 miliardo di dollari con importanti sostenitori come Nvidia, che attualmente domina lo sviluppo di chip per semiconduttori AI.

Grazie al suo approccio più ristretto, ovvero la creazione di avatar simili a quelli umani per uso aziendale, Synthesia ha eluso parte del clamore pubblicitario e della feroce concorrenza vista tra modelli di chatbot concorrenti come ChatGPT di OpenAI e Gemini chatbot di Google.

Rivista: Come ottenere migliori previsioni crittografiche da ChatGPT, pin Humane AI sbattuto: AI Eye