Nvidia tarafından desteklenen bir yapay zeka (AI) girişimi olan Synthesia, AI avatarlarının insan duygularını ve hareketlerini iletmesine olanak tanıyan yeni bir yükseltmeyi tanıttı.

25 Nisan'da şirket, kurumsal sunumlar, pazarlama ve eğitim amaçlı metin talimatlarına dayalı olarak duyguyu ifade etmeyi amaçlayan "Etkileyici Avatarlar"ı tanıttı.

Budur. Bu her şeyi değiştirir. Tarihte ilk kez,#AIavatarlarne dediklerini anlayabiliyor. Yeni AI avatar modelimiz EXPRESS-1 tarafından desteklenen, bir senaryonun duygusunu algılayabilir ve insan iletişiminin tüm ince nüanslarını gerçekleştirebilirler. pic.twitter.com/uj3WIjcGlm

- Sentez (@synthesiaIO) 25 Nisan 2024

Üretken yapay zeka, gerçekçi hareketli görüntüler oluşturma yeteneğinden dolayı sıklıkla övülse de, OpenAI'nin Sora video oluşturucusunda da durum aynı.

Bununla birlikte, yapay zekanın da kusurları yok değil, özellikle de sıklıkla çarpık eller veya uzuvlarla, kolajlanmış arka planlarla veya konuşmayla uyumsuz dudaklarla gösterilen insanları tasvir ederken.

Synthesia, stüdyolarında senaryoları okuyan gerçek insanlar üzerinde geliştirilen son sürümünde bu durumu düzeltmeyi amaçlıyor. Bu, botların dudak takibini yakalamasına ve duygusal ifadelerinde daha doğru olmasına yardımcı olmak için yapıldı.

Synthesia'nın CEO'su ve kurucu ortağı Victor Ribarbelli, bir videoda eksik parçanın insanlardan farklı olarak "avatarların ne dediğini anlamaması" olduğunu ve bu durumun daha önce duygulara yüz tepkisinin verilmemesine yol açtığını söyledi. .

Stüdyoda "Mutluyum" gibi basit yönlendirmelere yanıt vermek üzere eğitildiler. İmutsuzum. Verilen duyguyla ilişkili doğru yüz ifadelerini ve ses tonunu aktararak hayal kırıklığına uğradım”.

Kaynak: Sentez

Yeni avatarlar ayrıca 130'dan fazla dilde mevcut, kendi altyazılarını sunabiliyor ve hatta kullanıcıların kendi seslerini bile kopyalayabiliyor.

İlgili: Sam Altman, Fortune 500 şirketleri arasında ChatGPT'nin kitlesel olarak benimsenmesini teşvik ediyor: Rapor

Ancak Cointelegraph'ın model üzerinde yaptığı teste göre, Synthesia'nın web sitesinde İngilizce dışında Fransızca, Almanca ve İspanyolca gibi dillerde konuşan örnek avatar modelleri arasında İngilizce dili modeli en gelişmiş ve insana benzeyen model.

Başlangıçta, Fortune 100 şirketlerinin en az yarısının müşteri olarak listelendiği ve 55.000'den fazla işletmeye hizmet sağladığı bildiriliyor. Buna Zoom, Xerox, Microsoft ve Reuters gibi çeşitli sektörlerin liderleri de dahildir.

Synthesia, 2017 yılında kurulan Birleşik Krallık merkezli bir şirkettir. Geçen yılki yapay zeka patlamasının ardından, şu anda yapay zeka yarı iletken çip gelişimine hakim olan Nvidia gibi büyük destekçilerle yaklaşık 1 milyar dolarlık bir değerlemeye ulaştı.

Synthesia, iş amaçlı kullanım için insan benzeri avatarlar yaratma şeklindeki daha dar yaklaşımı nedeniyle, OpenAI'nin ChatGPT'si ve Google'ın Gemini chatbot'u gibi rakip chatbot modelleri arasında görülen abartılı ve şiddetli rekabetin bir kısmını bir kenara atıyor.

Dergi: ChatGPT'den nasıl daha iyi kripto tahminleri alınır, Humane AI PIN'i çarptı: AI Eye