• С новыми батареями CATL электрокары смогут проезжать более 1600 км

    Производитель аккумуляторов CATL решил сосредоточиться на литий-воздушных батареях — технологии, которая в будущем может кардинально изменить рынок электромобилей. Если разработка окажется успешной, владельцы электрокаров смогут забыть о регулярных поисках зарядных станций.
    Читать дальше
  • Magssory представит премиальные аксессуары на ПМЭФ-2026

    Бренд премиальных аксессуаров Magssory представлен на ПМЭФ в пространстве «Территория инноваций». Всего за три года компания прошла впечатляющий путь и сегодня уже представлена среди проектов, формирующих новую технологическую повестку российского бизнеса. За короткое время Magssory прошел путь от нового игрока до бренда, который создает ...
    Читать дальше
  • Галактику c чёрной дырой в центре показали на детализированном снимке (2 фото)

    Космический телескоп «Хаббл» сделал новое детальное изображение спиральной галактики Мессье 88 (M88), расположенной примерно в 63 миллионах световых лет от Земли. Учёные считают её хорошим примером того, как окружение способно постепенно менять судьбу целой галактики.
    Читать дальше
  • «Яндекс» создал нейросеть размером менее 200 килобайт

    «Яндекс» сообщил о разработке ультрамалой нейросетевой модели для голосового управления в носимых устройствах. Её размер удалось сократить примерно до 200 КБ без заметной потери качества распознавания речи. Это в несколько раз меньше объёма одной фотографии, сделанной на современный смартфон.
    Читать дальше
  • Башенный кран-принтер способен печатать целые небоскрёбы (видео)

    Австралийская компания Luyten представила первый в мире башенный кран с функцией 3D-печати. ASCEND способен создавать конструкции высотой до 100 метров и работать в радиусе до 45 метров.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 088 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.