• Blackview представила MEGA 5 — 12,2-дюймовый AI-планшет для продуктивной работы с комплектной клавиатурой, мышью и стилусом

    Многим пользователям смартфонов не хватает по-настоящему захватывающего большого экрана, а ноутбуки часто кажутся слишком тяжёлыми для лёгкой работы на ходу. Продолжая расширять линейку умных планшетов и многофункциональных устройств, компания Blackview представляет MEGA 5 — 12,2-дюймовый AI-планшет, который идеально сочетает в себе развл...
    Читать дальше
  • Роскомнадзор усилил блокировку Telegram, взявшись за MTProto-прокси

    С конца прошлой недели в России началась новая волна блокировок мессенджера Telegram. Формально сервис на территории страны не заблокирован, а замедлен. Тем не менее, на этот раз были брошены силы на блокировку используемых платформой прокси-серверов.
    Читать дальше
  • Acer представила первый ноутбук на Snapdragon C с ценой от 300$

    Очевидно, доступность и качество дизайна MacBook Neo от Apple задели производителей устройств на Windows. Qualcomm решила вступить в игру на бюджетном поле, представив платформу Snapdragon C. Первым устройством на её базе стал Acer Aspire Go 15. Согласно пресс-релизу Acer, ноутбук Aspire Go 15 появится в продаже по неопределённой «начальн...
    Читать дальше
  • Apple выпустила первую публичную бета-версию iOS 26.6

    Ранее на этой неделе Apple выпустила первую бета-версию iOS 26.6 для разработчиков. Теперь же стала доступна первая публичная бета-версия мобильной программной платформы производителя iPhone.
    Читать дальше
  • Red Bull готовит к выпуску гиперкар RB17 (4 фото)

    Red Bull приближается к запуску своей самой амбициозной разработки — гиперкара RB17. Машина создаётся как максимально близкий аналог болиду «Формулы-1», но только для обычных владельцев.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 025 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.