Synthesia, un startup de inteligență artificială (AI) susținut de Nvidia, a introdus o nouă actualizare care le permite avatarurilor AI să transmită emoții și mișcări umane.

Pe 25 aprilie, compania și-a dezvăluit „Avatarurile expresive”, care își propun să exprime emoția pe baza instrucțiunilor text pentru prezentări corporative, marketing și instruire.

Asta este. Asta schimbă totul. Pentru prima dată în istorie,#AIavatarssunt capabili să înțeleagă ce spun. Cu ajutorul noului nostru model de avatar AI, EXPRESS-1, ei pot detecta sentimentele unui script și pot realiza toate nuanțele subtile ale comunicării umane. pic.twitter.com/uj3WIjcGlm

— Synthesia (@synthesiaIO) 25 aprilie 2024

În timp ce AI generativă a fost adesea lăudată pentru capacitatea sa de a crea imagini în mișcare realiste, așa este cazul generatorului de videoclipuri Sora de la OpenAI.

Cu toate acestea, inteligența artificială nu este lipsită de defecte, mai ales atunci când înfățișează oameni, care sunt adesea arătați cu mâini sau membre distorsionate, fundaluri colajate sau buzele nesincronizate cu vorbirea.

Synthesia își propune să corecteze acest lucru în cea mai recentă versiune, care a fost dezvoltată pe oameni care citesc scenarii în studioul lor. Acest lucru a fost făcut pentru a ajuta roboții să captureze urmărirea buzelor și să fie mai precisi în expresiile lor emoționale.

Victor Ribarbelli, CEO-ul și co-fondatorul Synthesia, a declarat într-un videoclip că piesa lipsă a fost aceea că, spre deosebire de oameni, „avatarurile nu înțeleg ce spun”, ceea ce a condus anterior la lipsa răspunsului facial la emoții. .

În studio, ei au fost instruiți să răspundă la solicitări simple de genul „Sunt fericit. Sunt trist. Sunt frustrat” prin transmiterea expresiilor faciale corecte și a tonului asociat cu emoția dată.

Sursa: Synthesia

Noile avatare sunt, de asemenea, disponibile în peste 130 de limbi, pot oferi propriile subtitrări și chiar pot clona propriile voci ale utilizatorilor.

În legătură cu: Sam Altman promovează adoptarea în masă a ChatGPT în rândul companiilor din Fortune 500: Raport

Cu toate acestea, dintre modelele de exemplu de avatare de pe site-ul Synthesia care vorbesc în alte limbi decât engleza, cum ar fi franceză, germană și spaniolă, modelul în limba engleză este cel mai avansat și mai asemănător uman, conform unui test Cointelegraph al modelului.

Se pare că startup-ul are cel puțin jumătate din companiile Fortune 100 listate ca clienți și oferă servicii pentru peste 55.000 de întreprinderi. Aceasta include lideri din diverse industrii, cum ar fi Zoom, Xerox, Microsoft și Reuters, printre altele.

Synthesia este o companie cu sediul în Regatul Unit, fondată în 2017. În urma boom-ului AI din ultimul an, a atins o evaluare de aproape 1 miliard de dolari cu susținători importanți precum Nvidia – care domină în prezent dezvoltarea de cipuri de semiconductori AI.

Datorită abordării sale mai restrânse - crearea de avatare asemănătoare oamenilor pentru uz comercial - Synthesia a ocolit o parte din hype-ul și competiția acerbă văzută între modelele de chatbot concurente, cum ar fi ChatGPT de la OpenAI și chatbot-ul Gemini de la Google.

Revista: Cum să obțineți predicții cripto mai bune de la ChatGPT, pinul Humane AI trântit: AI Eye