• Roblox разблокировали на территории РФ

    В декабре прошлого года российские геймеры заметили, что больше не могут спокойно зайти в Roblox — популярную среди детей платформу для создания игр. Её, как оказалось, официально заблокировали на территории России из-за обилия мошенников. Разработчики игры сразу же пошли на диалог с властями и попытались добиться снятия блокировки. Спуст...
    Читать дальше
  • Xiaomi 17T и 17T Pro поступили в продажу на Wildberries и в Яндекс Маркете

    Линейка смартфонов Xiaomi 17T официально вышла на российские маркетплейсы. Новинки получили флагманские процессоры MediaTek, обновленные камеры Leica и кремний-углеродные аккумуляторы повышенной емкости.
    Читать дальше
  • Китайские водители нашли необычный способ взлома «автопилота» Tesla

    Система Full Self-Driving (FSD) в электрокарах Tesla требует активного участия человека в процессе поездки. Однако водители из Китая нашли необычную лазейку в работе «автопилота», позволяющую листать соцсети или даже дремать за рулём даже под бдительным взглядом бортовой камеры.
    Читать дальше
  • Xbox раскрыла, сколько потеряла из-за повышения цен на Game Pass

    Компания Microsoft уже долгое время пытается закрыть убытки Xbox, в том числе повышая цены на свою подписку Game Pass. Вот только оказалось, что геймеры не готовы с этим мириться.
    Читать дальше
  • В сервисе Google Earth появился встроенный авиасимулятор

    Google добавила в веб-версию сервиса «Планета» новый экспериментальный режим авиасимулятора, который позволяет исследовать планету с высоты птичьего полёта, управляя виртуальным самолётом. Это делает изучение карт более интерактивным и похожим на Microsoft Flight Simulator, но только бесплатно и доступно для всех.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 130 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.