Synthesia, startup kecerdasan buatan (AI) yang didukung oleh Nvidia, telah memperkenalkan peningkatan baru yang memungkinkan avatar AI menyampaikan emosi dan gerakan manusia.

Pada tanggal 25 April, perusahaan tersebut meluncurkan “Avatar Ekspresif,” yang bertujuan untuk mengekspresikan emosi berdasarkan instruksi teks untuk tujuan presentasi, pemasaran, dan pelatihan perusahaan.

Ini dia. Ini mengubah segalanya. Untuk pertama kalinya dalam sejarah,#AIavatardapat memahami apa yang mereka katakan.Didukung oleh model avatar AI baru kami, EXPRESS-1, mereka dapat mendeteksi sentimen skrip dan melakukan semua nuansa halus komunikasi manusia.… pic.twitter.com/uj3WIjcGlm

— Sinthesia (@synthesiaIO) 25 April 2024

Meskipun AI generatif sering dipuji karena kemampuannya membuat gambar bergerak yang realistis, hal serupa terjadi pada generator video Sora OpenAI.

Namun, AI bukannya tanpa kekurangan, terutama saat menggambarkan manusia, yang sering kali ditampilkan dengan tangan atau anggota tubuh yang terdistorsi, latar belakang yang terkoordinasi, atau bibir yang tidak selaras dengan ucapan.

Synthesia bertujuan untuk memperbaikinya dalam versi terbarunya, yang dikembangkan pada manusia sebenarnya yang membaca skrip di studio mereka. Hal ini dilakukan untuk membantu bot menangkap pelacakan bibir dan lebih akurat dalam ekspresi emosinya.

Victor Ribarbelli, CEO dan salah satu pendiri Synthesia, mengatakan dalam sebuah video bahwa hal yang hilang adalah, tidak seperti manusia, “avatar tidak mengerti apa yang mereka katakan” yang sebelumnya menyebabkan kurangnya respons wajah terhadap emosi .

Di studio, mereka dilatih untuk merespons pertanyaan sederhana seperti, “Saya senang. Aku sedih. Saya frustrasi” dengan menyampaikan ekspresi wajah dan nada yang benar terkait dengan emosi yang diberikan.

Sumber: Sintesis

Avatar baru ini juga tersedia dalam lebih dari 130 bahasa, dapat memberikan teks tertulisnya sendiri, dan bahkan mengkloning suara penggunanya sendiri.

Terkait: Sam Altman mendorong adopsi massal ChatGPT di antara perusahaan-perusahaan Fortune 500: Laporan

Namun, di antara contoh model avatar di situs Synthesia yang berbicara dalam bahasa selain bahasa Inggris seperti Prancis, Jerman, dan Spanyol, model bahasa Inggris adalah yang paling canggih dan mirip manusia, menurut pengujian model Cointelegraph.

Startup ini dilaporkan memiliki setidaknya setengah dari perusahaan Fortune 100 yang terdaftar sebagai klien dan menyediakan layanan kepada lebih dari 55.000 perusahaan. Hal ini mencakup para pemimpin di berbagai industri seperti Zoom, Xerox, Microsoft dan Reuters.

Synthesia adalah perusahaan yang berbasis di Inggris yang didirikan pada tahun 2017. Setelah booming AI selama setahun terakhir, perusahaan ini telah mencapai valuasi hampir $1 miliar dengan pendukung besar seperti Nvidia – yang saat ini mendominasi pengembangan chip semikonduktor AI.

Karena pendekatannya yang lebih sempit —menciptakan avatar mirip manusia untuk penggunaan bisnis — Synthesia telah mengesampingkan beberapa hype dan persaingan sengit yang terlihat antara model chatbot yang bersaing seperti ChatGPT OpenAI dan chatbot Gemini Google.

Majalah: Cara mendapatkan prediksi kripto yang lebih baik dari ChatGPT, pin AI yang manusiawi dibanting: AI Eye