由 Nvidia 支持的人工智能 (AI) 初創公司 Synthesia 推出了一項新升級,使 AI 化身能夠傳達人類的情感和動作。

4月25日,該公司推出了“富有表現力的虛擬形象”,旨在根據文本指令表達情感,用於企業演示、營銷和培訓目的。

就是這樣。這改變了一切。歷史上第一次#AIavatars能夠理解他們在說什麼。在我們的新 AI 頭像模型 EXPRESS-1 的支持下,它們可以檢測腳本的情緒並執行人類交流的所有細微差別。… pic.twitter.com/uj3WIjcGlm

- Synthesia (@synthesiaIO) 2024 年 4 月 25 日

雖然生成式人工智能經常因其創建逼真的運動圖像的能力而受到稱讚,但 OpenAI 的 Sora 視頻生成器就是這種情況。

然而,人工智能並非沒有缺陷,特別是在描繪人類時,人類的手或四肢經常扭曲,背景拼貼,或者嘴脣與言語不同步。

Synthesia 旨在通過最新版本來糾正這個問題,該版本是在工作室中以真人朗讀腳本爲基礎開發的。這樣做是爲了幫助機器人捕捉脣部跟蹤並更準確地表達情緒。

Synthesia 首席執行官兼聯合創始人 Victor Ribarbelli 在一段視頻中表示,缺失的部分是,與人類不同,“虛擬形象不明白他們在說什麼”,這導致它們缺乏對情緒的面部反應。

在工作室裏,他們接受訓練,通過表達與特定情緒相關的正確面部表情和語調,對簡單的提示做出反應,例如“我很高興。我很傷心。我很沮喪”。

資料來源:綜合

新的虛擬形象還支持 130 多種語言,可以提供自己的隱藏字幕,甚至可以克隆用戶自己的聲音。

相關:Sam Altman 推動財富 500 強企業大規模採用 ChatGPT:報告

然而,根據 Cointelegraph 對該模型的測試,在 Synthesia 網站上使用法語、德語和西班牙語等英語以外的語言的化身示例模型中,英語模型是最先進、最像人類的。

據報道,這家初創公司至少有一半的財富 100 強企業是其客戶,併爲超過 55,000 家企業提供服務。其中包括 Zoom、施樂、微軟和路透社等各個行業的領導者。

Synthesia 是一家總部位於英國的公司,成立於 2017 年。在去年人工智能熱潮的推動下,該公司的估值已達到近 10 億美元,主要支持者包括 Nvidia,而 Nvidia 目前在人工智能半導體芯片開發中佔據主導地位。

由於其方法更爲狹隘——爲商業用途創建類似人類的化身——Synthesia 一直在避開競爭對手聊​​天機器人模型(如 OpenAI 的 ChatGPT 和谷歌的 Gemini 聊天機器人)之間的一些炒作和激烈的競爭。

雜誌:如何從 ChatGPT 獲得更好的加密貨幣預測,人性化 AI 大受抨擊:AI Eye