• В ядре Земли нашли водорода на 45 океанов — гипотеза кометного происхождения воды под вопросом

    Новое исследование представило экспериментальные доказательства того, что ядро нашей планеты является крупнейшим резервуаром водорода на Земле. Учёные давно подозревали, что помимо железа в ядре присутствуют лёгкие элементы, объясняющие его меньшую плотность по сравнению с чистым железом. Водород считается одним из главных кандидатов н...
    Читать дальше
  • Ugreen представил дешёвую альтернативу AirTag (4 фото)

    На российском рынке появилась новая категория продуктов Ugreen — трекер-метки для поиска вещей FineTrack. Устройства, сертифицированные Apple, Samsung и Google, обеспечивают глобальное отслеживание, поддерживают оповещения и защитную функцию антитрекинга.
    Читать дальше
  • Компьютер, который легко поместится в кармане (3 фото)

    Компания Minix представила Neo Z95 — один из самых компактных настольных компьютеров на рынке. Устройство без проблем помещается в кармане, но всё же это полноценный компьютер со всеми необходимыми портами для выполнения повседневных задач.
    Читать дальше
  • РКН перестал замедлять WhatsApp и приступил к полной блокировке

    Домен мессенджера WhatsApp — whatsapp.com — удалили из Национальной системы доменных имён (НСДИ), что означает переход от замедления или ограничения работы мессенджера Роскомнадзором к его полной блокировке. Та же участь постигла домен YouTube.
    Читать дальше
  • Илон Маск сообщил о скором запуске X Money — сервиса, «где будут храниться все деньги» пользователей X

    Илон Маск давно стремится превратить соцсеть X в «суперприложение», и большим шагом к этому станет внедрение в неё сервиса X Money для управления личными финансами. По его замыслу, пользователи смогут обмениваться сообщениями, совершать покупки и полностью управлять своими личными активами в одном месте. Маск сообщил, что X Money уже п...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 483 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.