• Автомобильный аккумулятор CATL способен за 10 минут зарядиться на 600 км пути

    На проходящем в эти дни Пекинском автосалоне китайская компания CATL анонсировала первую в мире литий-железо-фосфатную аккумуляторную батарею Shenxing Plus. Она предназначена для использования в электрокарах и способна обеспечить запас хода до тысячи километров. Помимо повышенной плотности энергии, она ещё и поддерживает скоростную зарядк...
    Читать дальше
  • Японский аппарат SLIM вышел на связь и прислал фото с Луны

    Японский аппарат Smart Lander for Investigation Moon (SLIM) сумел пережить третью лунную ночь и после её завершения 23 апреля снова вышел на связь. Это достижение является примечательным, поскольку аппарат изначально не был рассчитан справляться с суровыми условиями во время лунной ночи, когда температура окружающего пространства опускает...
    Читать дальше
  • Google вновь отложила блокировку сторонних cookie в браузере Chrome

    В начале этого года Google объявила о введении блокировки сторонних файлов cookie для 1 % пользователей браузера Chrome, являющегося самым популярным интернет-обозревателем в мире. Однако с тех пор компания не сильно продвинулась в этом направлении и на этой неделе было объявлено, что блокировка файлов cookie для всех пользователей браузе...
    Читать дальше
  • Tesla начнёт применять роботов Optimus в конце года, а в продажу они поступят в следующем

    Электромобильный бизнес Tesla, вне всякого сомнения, был в центре внимания на квартальном отчётном мероприятии, но руководство компании нашло возможность напомнить о прогрессе в сфере разработки человекоподобных роботов Optimus. Начать их применение на собственных предприятиях планируется к концу текущего года, а в продажу они поступят в ...
    Читать дальше
  • МКС стала рассадником устойчивых к антибиотикам бактерий-мутантов

    Очевидно, что присутствие островка жизни на орбите в виде Международной космической станции создало там особые условия для эволюции бактерий, которых никогда не было на Земле. Микрогравитация и радиация заставляют бактерии мутировать непредсказуемым для учёных образом и можно только догадываться, к чему это приведёт. Предварительные иссле...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 14 508 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.