• Космические дата-центры SpaceX будут охлаждаться жидким аммиаком — и это усложнит их утилизацию

    Глава и основатель SpaceX Илон Маск поделился подробностями об устройстве своих космических ЦОД, которыми он буквально намерен заполнить околоземное пространство в ближайшие годы. Каждый такой космический аппарат размером с авиалайнер будет использовать систему жидкостного охлаждения, однако её наполнение не позволит утилизировать такие с...
    Читать дальше
  • Nintendo оштрафовали на 35 миллионов евро за дрифт стиков Joy-Con

    Одной из главных проблем консоли Nintendo Switch были дрифтующие стики — элементы управления массового выходили из строя. Теперь компании придётся выплатить 35 миллионов евро штрафа.
    Читать дальше
  • Роскомнадзор и Минцифры увидели основания для разблокировки Roblox в России

    Газета «Коммерсантъ» со ссылкой на пресс-службу Министерства цифрового развития, связи и массовых коммуникаций РФ (Минцифры) сообщила о скорой разблокировке в России игровой платформы Roblox от Roblox Corporation.
    Читать дальше
  • Все смартфоны в России поставят на учёт по IMEI

    Госдума во втором и третьем чтениях приняла «Антифрод 2.0» — пакет поправок к законам, направленный на борьбу с кибермошенниками. Он включает комплекс мер, которые, по задумке законодателей, помогут в противодействии преступной деятельности в интернете, пишут «Ведомости» со ссылкой на заявление главы комитета Госдумы по информационной пол...
    Читать дальше
  • Вышла полноценная версия Telegram для Apple Watch

    Спустя более чем десять лет после выхода первого варианта приложения Telegram для Apple Watch и последующего прекращения его поддержки мессенджер выпустил обновлённый вариант нативного клиента для умных часов.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 115 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.