• Роботы Figure AI больше недели сортируют посылки в прямом эфире — зрители делают ставки на их поломку (видео)

    Стартап в области робототехники Figure AI уже больше недели ведёт прямую трансляцию, на которой человекоподобные роботы помещают тысячи посылок на конвейерную ленту. В эфире появлялось руководство компании, а в какой-то момент с роботами состязался и человек.
    Читать дальше
  • Астрономы нашли «умеренный Сатурн» почти с земным климатом, а «Уэбб» впервые детально изучил его атмосферу

    Учёные из США провели уникальное исследование атмосферы редкой экзопланеты масштаба Сатурна. Удачное сочетание факторов позволило космической обсерватории «Джеймс Уэбб» впервые детально изучить атмосферу экзопланеты, чей климат не так уж принципиально отличается от земного. Обычно такие планеты или слишком горячие, или ледяные, тогда как ...
    Читать дальше
  • Китай запустит на Луну «кентавров» — человекоподобных роботов на колёсных шасси

    На днях стало известно, что две следующие миссии по отправке Китаем луноходов на естественный спутник Земли будут весьма необычными. Для них создаются особенные роверы — с «человеческим» торсом на колёсных шасси. Это позволит автономным аппаратам совершать сложные действия на поверхности Луны с использованием пары «рук», что поможет в раз...
    Читать дальше
  • Blackview ROCK 5 — защищённый флагман с фонарём 348 люмен, Hi-Fi динамиком 5 Вт и защитой IP68/IP69K

    Для профессионалов, работников на открытом воздухе и любителей техники суровые условия часто создают проблемы: плохое освещение, шум, беспокойство о заряде батареи и надёжности устройства. В таких ситуациях пользователям нужно нечто большее, чем просто прочность — им требуется многофункциональное защищённое устройство, которое объединяет ...
    Читать дальше
  • Китайские учёные впервые воспроизвели механизм гибели нашей Вселенной в сценарии ложного вакуума

    Если наша Вселенная родилась и существует в условиях ложного вакуума, то её и нас с вами ждёт мгновенная гибель в любой момент времени. До недавнего времени это была только гипотеза. Однако учёные из Китая впервые воспроизвели в лабораторном эксперименте квантово-механические явления перехода ложного вакуума в истинный, доказав, что опыт ...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 940 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.