由 Nvidia 支持的人工智能 (AI) 初创公司 Synthesia 推出了一项新升级,使 AI 化身能够传达人类的情感和动作。

4月25日,该公司推出了“富有表现力的虚拟形象”,旨在根据文本指令表达情感,用于企业演示、营销和培训目的。

就是这样。这改变了一切。历史上第一次#AIavatars能够理解他们在说什么。在我们的新 AI 头像模型 EXPRESS-1 的支持下,它们可以检测脚本的情绪并执行人类交流的所有细微差别。… pic.twitter.com/uj3WIjcGlm

- Synthesia (@synthesiaIO) 2024 年 4 月 25 日

虽然生成式人工智能经常因其创建逼真的运动图像的能力而受到称赞,但 OpenAI 的 Sora 视频生成器就是这种情况。

然而,人工智能并非没有缺陷,特别是在描绘人类时,人类的手或四肢经常扭曲,背景拼贴,或者嘴唇与言语不同步。

Synthesia 旨在通过最新版本来纠正这个问题,该版本是在工作室中以真人朗读脚本为基础开发的。这样做是为了帮助机器人捕捉唇部跟踪并更准确地表达情绪。

Synthesia 首席执行官兼联合创始人 Victor Ribarbelli 在一段视频中表示,缺失的部分是,与人类不同,“虚拟形象不明白他们在说什么”,这导致它们缺乏对情绪的面部反应。

在工作室里,他们接受训练,通过表达与特定情绪相关的正确面部表情和语调,对简单的提示做出反应,例如“我很高兴。我很伤心。我很沮丧”。

资料来源:综合

新的虚拟形象还支持 130 多种语言,可以提供自己的隐藏字幕,甚至可以克隆用户自己的声音。

相关:Sam Altman 推动财富 500 强企业大规模采用 ChatGPT:报告

然而,根据 Cointelegraph 对该模型的测试,在 Synthesia 网站上使用法语、德语和西班牙语等英语以外的语言的化身示例模型中,英语模型是最先进、最像人类的。

据报道,这家初创公司至少有一半的财富 100 强企业是其客户,并为超过 55,000 家企业提供服务。其中包括 Zoom、施乐、微软和路透社等各个行业的领导者。

Synthesia 是一家总部位于英国的公司,成立于 2017 年。在去年人工智能热潮的推动下,该公司的估值已达到近 10 亿美元,主要支持者包括 Nvidia,而 Nvidia 目前在人工智能半导体芯片开发中占据主导地位。

由于其方法更为狭隘——为商业用途创建类似人类的化身——Synthesia 一直在避开竞争对手聊​​天机器人模型(如 OpenAI 的 ChatGPT 和谷歌的 Gemini 聊天机器人)之间的一些炒作和激烈的竞争。

杂志:如何从 ChatGPT 获得更好的加密货币预测,人性化 AI 大受抨击:AI Eye