• Китайские компании превзошли американских конкурентов в сфере генерации видео при помощи ИИ

    Опрошенные Financial Times эксперты сходятся во мнении, что если американские разработчики систем ИИ занимают лидирующие позиции в создании ассистентов для написания программного кода, то в сфере генерации видео по текстовому запросу на первых местах уже находятся китайские разработчики. Их инструменты лучше по качеству и удобству использ...
    Читать дальше
  • Blackview ROCK 5 — защищённый флагман с фонарём 348 люмен, Hi-Fi динамиком 5 Вт и защитой IP68/IP69K

    Для профессионалов, работников на открытом воздухе и любителей техники суровые условия часто создают проблемы: плохое освещение, шум, беспокойство о заряде батареи и надёжности устройства. В таких ситуациях пользователям нужно нечто большее, чем просто прочность — им требуется многофункциональное защищённое устройство, которое объединяет ...
    Читать дальше
  • Китайские учёные впервые воспроизвели механизм гибели нашей Вселенной в сценарии ложного вакуума

    Если наша Вселенная родилась и существует в условиях ложного вакуума, то её и нас с вами ждёт мгновенная гибель в любой момент времени. До недавнего времени это была только гипотеза. Однако учёные из Китая впервые воспроизвели в лабораторном эксперименте квантово-механические явления перехода ложного вакуума в истинный, доказав, что опыт ...
    Читать дальше
  • Роботы научились копировать человеческие навыки, просто наблюдая за людьми (3 фото)

    Человек может учиться определённым действиям как у других людей, так и, в отдельных случаях, у животных. Роботов можно программировать на определённые последовательности действий, а повторение навыков человека и других машин — задача более сложная, поскольку роботы могут отличаться по строению. Решение этой задачи предложили инженеры Феде...
    Читать дальше
  • Глава Seagate уронил акции производителей памяти заявлением о бессмысленности новых фабрик

    Производители памяти не скрывают своих намерений вводить в строй дополнительные мощности, а вот представители смежного сегмента накопителей подобную точку зрения на ситуацию в отрасли не разделяют. Глава Seagate обвалил котировки акций своими заявлениями о том, что строить новые фабрики слишком долго и нет особого смысла.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 933 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.