Стартап AI при поддержке Nvidia выпускает аватары, выражающие человеческие эмоции

Synthesia, стартап в области искусственного интеллекта (ИИ), поддерживаемый Nvidia, представил новое обновление, позволяющее аватарам с искусственным интеллектом передавать человеческие эмоции и движения.
25 апреля компания представила свои «Выразительные аватары», целью которых является выражение эмоций на основе текстовых инструкций для корпоративных презентаций, маркетинговых и учебных целей.
Это оно. Это меняет все. Впервые в истории #AIаватары способны понимать, что они говорят. Благодаря нашей новой модели аватаров с искусственным интеллектом EXPRESS-1 они могут определять тональность сценария и выполнять все тонкие нюансы человеческого общения.… pic.twitter.com/uj3WIjcGlm
– Синтезия (@synthesiaIO) 25 апреля 2024 г.
Хотя генеративный ИИ часто хвалят за его способность создавать реалистичные движущиеся изображения, так обстоит дело и с видеогенератором Sora от OpenAI.
Однако ИИ не лишен недостатков, особенно при изображении людей, которых часто изображают с искаженными руками или конечностями, коллажным фоном или губами, не синхронизированными с речью.
Synthesia стремится исправить это в своей последней версии, которая была разработана на основе реальных людей, читающих сценарии в своей студии. Это было сделано, чтобы помочь ботам фиксировать движения губ и точнее выражать эмоции.
Виктор Рибарбелли, генеральный директор и сооснователь Synthesia, заявил в видеоролике, что недостающая часть заключается в том, что, в отличие от людей, «аватары не понимают, что они говорят», что ранее приводило к отсутствию реакции лица на эмоции. .
В студии их учили реагировать на простые подсказки вроде: «Я счастлив. Мне грустно. Я расстроен», передавая правильную мимику и тон, связанные с данной эмоцией.
Источник: Синтезия
Новые аватары также доступны на более чем 130 языках, могут иметь собственные субтитры и даже клонировать собственные голоса пользователей.
Связанный: Сэм Альтман продвигает массовое внедрение ChatGPT среди компаний из списка Fortune 500: отчет
Однако, согласно тесту модели Cointelegraph, среди примеров моделей аватаров на веб-сайте Synthesia, говорящих на языках, отличных от английского, таких как французский, немецкий и испанский, английская языковая модель является наиболее продвинутой и похожей на человека.
Сообщается, что в качестве клиентов стартапа фигурирует не менее половины компаний из списка Fortune 100, и он предоставляет услуги более чем 55 000 предприятиям. Сюда входят лидеры различных отраслей, таких как Zoom, Xerox, Microsoft и Reuters и другие.
Synthesia — британская компания, основанная в 2017 году. Вслед за бумом искусственного интеллекта в прошлом году ее оценка достигла почти 1 миллиарда долларов благодаря таким крупным спонсорам, как Nvidia, которые в настоящее время доминируют в разработке полупроводниковых чипов искусственного интеллекта.
Благодаря своему более узкому подходу — созданию человекоподобных аватаров для использования в бизнесе — Synthesia сумела обойти некоторую шумиху и жесткую конкуренцию, наблюдаемую между конкурирующими моделями чат-ботов, такими как ChatGPT от OpenAI и чат-бот Gemini от Google.
Журнал: Как получить более точные прогнозы криптовалюты от ChatGPT, пин Humane AI раскритикован: AI Eye
Стартап AI при поддержке Nvidia выпускает аватары, выражающие человеческие эмоции

Другие публикации автора

Последние новости

Стартап AI при поддержке Nvidia выпускает аватары, выражающие человеческие эмоции

Другие публикации автора

Последние новости

Популярные статьи