Synthesia, uma startup de inteligência artificial (IA) apoiada pela Nvidia, introduziu uma nova atualização que permite que avatares de IA transmitam emoções e movimentos humanos.

No dia 25 de abril, a empresa revelou seus “Avatares Expressivos”, que visam expressar emoções com base em instruções de texto para apresentações corporativas, marketing e fins de treinamento.

É isso. Isso muda tudo. Pela primeira vez na história,#AIavatarssão capazes de entender o que estão dizendo. Desenvolvidos por nosso novo modelo de avatar de IA, EXPRESS-1, eles podem detectar o sentimento de um script e executar todas as nuances sutis da comunicação humana. pic.twitter.com/uj3WIjcGlm

– Synthesia (@synthesiaIO) 25 de abril de 2024

Embora a IA generativa tenha sido frequentemente elogiada por sua capacidade de criar imagens em movimento realistas, tal é o caso do gerador de vídeo Sora da OpenAI.

No entanto, a IA tem as suas falhas, especialmente quando retrata humanos, que muitas vezes são mostrados com mãos ou membros distorcidos, fundos colados ou lábios fora de sincronia com a fala.

Synthesia pretende corrigir isso em sua versão mais recente, que foi desenvolvida em humanos reais lendo roteiros em seu estúdio. Isso foi feito para ajudar os bots a capturar o rastreamento labial e a serem mais precisos em suas expressões emotivas.

Victor Ribarbelli, CEO e cofundador da Synthesia, disse em um vídeo que a peça que faltava era que, ao contrário dos humanos, “os avatares não entendem o que estão dizendo”, o que anteriormente levava à falta de resposta facial às emoções .

No estúdio, eles foram treinados para responder a instruções simples como: “Estou feliz. Estou triste. Estou frustrado” ao transmitir as expressões faciais corretas e o tom associado à emoção em questão.

Fonte: Síntese

Os novos avatares também estão disponíveis em mais de 130 idiomas, podem fornecer suas próprias legendas e até mesmo clonar as vozes dos próprios usuários.

Relacionado: Sam Altman impulsiona a adoção em massa do ChatGPT entre as empresas Fortune 500: Relatório

No entanto, entre os modelos de exemplo de avatares no site da Synthesia que falam outros idiomas além do inglês, como francês, alemão e espanhol, o modelo em inglês é o mais avançado e semelhante ao humano, de acordo com um teste do modelo pelo Cointelegraph.

A startup supostamente tem pelo menos metade das empresas da Fortune 100 listadas como clientes e fornece serviços para mais de 55.000 empresas. Isso inclui líderes de diversos setores, como Zoom, Xerox, Microsoft e Reuters, entre outros.

Synthesia é uma empresa sediada no Reino Unido fundada em 2017. Na esteira do boom da IA ​​​​no último ano, atingiu uma avaliação de quase US$ 1 bilhão com grandes patrocinadores como a Nvidia – que atualmente domina o desenvolvimento de chips semicondutores de IA.

Devido à sua abordagem mais restrita – criação de avatares semelhantes a humanos para uso comercial – a Synthesia tem evitado parte do entusiasmo e da competição acirrada observada entre modelos de chatbot concorrentes, como o ChatGPT da OpenAI e o chatbot Gemini do Google.

Revista: Como obter melhores previsões de criptografia do ChatGPT, Humane AI pin slammed: AI Eye