• Энтузиасты разогнали дрон до рекордных 733 км/ч — он почти догнал авиалайнер (видео)

    Любые транспортные средства неизбежно начинают соперничать друг с другом в определённых характеристиках, и в случае с дронами конкуренция развивается в части достижения максимальной скорости полёта. Дуэт энтузиастов недавно показал способность усовершенствованного ими дрона развивать скорость 730 км/ч, и это можно считать заявкой на миров...
    Читать дальше
  • Роботы Figure AI больше недели сортируют посылки в прямом эфире — зрители делают ставки на их поломку (видео)

    Стартап в области робототехники Figure AI уже больше недели ведёт прямую трансляцию, на которой человекоподобные роботы помещают тысячи посылок на конвейерную ленту. В эфире появлялось руководство компании, а в какой-то момент с роботами состязался и человек.
    Читать дальше
  • Астрономы нашли «умеренный Сатурн» почти с земным климатом, а «Уэбб» впервые детально изучил его атмосферу

    Учёные из США провели уникальное исследование атмосферы редкой экзопланеты масштаба Сатурна. Удачное сочетание факторов позволило космической обсерватории «Джеймс Уэбб» впервые детально изучить атмосферу экзопланеты, чей климат не так уж принципиально отличается от земного. Обычно такие планеты или слишком горячие, или ледяные, тогда как ...
    Читать дальше
  • В Китае представлен первый универсальный робот для помощи по дому — ему уже ищут семью

    20 мая в Ухане компания Hubei GigaBrain представила, как она заявляет, первого универсального человекоподобного робота для помощи по дому — модель Shiguang S1. Робот оснащён встроенным искусственным интеллектом для постоянного совершенствования навыков выполнения домашних дел и общения с людьми. Производитель пока не готов продавать новин...
    Читать дальше
  • Паровая революция в лечении мужской проблемы

    Проблемы с мужским здоровьем долгое время лечили либо таблетками, либо достаточно травматичными операциями. Сегодня ситуация меняется: в урологии появились малоинвазивные технологии, которые позволяют проводить лечение без разрезов и общего наркоза. Знакомьтесь: технология, которая достойна места в нашем обзоре.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 965 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.