• США подготовили новые антикитайские санкции, которые ударят по Micron, Samsung и SK hynix

    Нынешней администрации президента США Джозефа Байдена осталось работать около двумя месяцев, ведь во второй половине января Белый дом займёт Дональд Трамп. Поэтому чиновники работают в поте лица, чтобы довести задуманное ранее до реализации. Это может сыграть на руку китайской полупроводниковой промышленности — новый пакет санкций против ...
    Читать дальше
  • Китайцы придумали навечно записывать данные в алмазах

    В журнале Nature Photonics вышла статья, в которой учёные из Университета науки и технологий Китая в Хэфэе представили технологию высокоплотной оптической записи с возможностью хранения данных в течение миллионов лет. На один алмазный оптический диск размерами с обычный DVD поместится в 10 000 раз больше информации, чем в случае самого DV...
    Читать дальше
  • Raspberry Pi представила одноплатный компьютер Compute Module 5 без портов ввода-вывода (3 фото)

    Компания Raspberry Pi представила компактный одноплатный компьютер под названием Compute Module 5. Фактически, это вариант компактного одноплатного компьютера Raspberry Pi 5, лишённый традиционного набора портов и разъёмов. Предназначен новинка для встраиваемых решений.
    Читать дальше
  • Microsoft угодила под тотальное антимонопольное расследование в США

    Федеральная торговая комиссия США начала антимонопольное расследование в отношении Microsoft, сообщило агентство Bloomberg. По данным источников агентства, комиссия направила компании подробный запрос на предоставление информации, касающейся лицензирования программного обеспечения, кибербезопасности и ИИ. Таким образом, Microsoft стала пя...
    Читать дальше
  • 36 000 графических процессоров AMD создали крупнейшую модель Вселенной (видео)

    Вселенная слишком большая и старая, чтобы в реальном времени наблюдать за происходящими в ней процессами. Между тем, только наблюдения дают истинные представления о мире, в котором мы живём. Выход находится в моделировании. Суперкомпьютеры могут воссоздавать модель Вселенной в определённых рамках, но требуют взамен использования немалых р...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 15 270 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.