• WD анонсировала скоростные HDD нового поколения (4 фото)

    Компания Western Digital (WD) объявила о готовящейся премьере двух новых серий жёстких дисков. Первая будет выделяться впечатляющей по меркам HDD скоростью чтения и записи, а вторая ориентирована на высокую энергоэффективность при долгом «холодном» хранении данных.
    Читать дальше
  • AMD: Новая Xbox будет готова к запуску в 2027 году

    Из-за ряда очень странных, зачастую неочевидных управленческих решений Microsoft геймеры вот уже несколько лет как хоронят бренд Xbox. Однако им стоит отложить лопаты: по слухам, в следующем году корпорация выпустит наследницу Xbox Series.
    Читать дальше
  • Tesla выпустила ускоренную версию электрокара Model Y (2 фото)

    Компания Tesla представила новый вариант фирменного электрического кроссовера. Новинка стоит чуть дороже базовой версии, предлагая при этом уменьшенное на 47% временем разгона до 100 км/ч и ещё несколько полезных модификаций.
    Читать дальше
  • Canon выпустила юбилейную версию фотоаппарата G7 X Mark III (4 фото)

    По случаю 30-летия серии PowerShot компания Canon представила лимитированную версию модели G7 X Mark III. Заодно были анонсированы новые аксессуары для этой и других фирменных цифровых камер.
    Читать дальше
  • Оперативная память и SSD подорожают почти вдвое в текущем квартале — как для ПК, так и для серверов

    Цены на компьютерную память вырастут на 90 % и даже выше по итогам первого квартала 2026 года по сравнению с последней четвертью 2025 года, что является беспрецедентным и рекордным скачком, говорится в свежем отчёте аналитической компании Counterpoint Research. Это уже не первые аналитики, предрекающие памяти почти двукратное подорожан...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 468 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.