• Blackview представила MEGA 5 — 12,2-дюймовый AI-планшет для продуктивной работы с комплектной клавиатурой, мышью и стилусом

    Многим пользователям смартфонов не хватает по-настоящему захватывающего большого экрана, а ноутбуки часто кажутся слишком тяжёлыми для лёгкой работы на ходу. Продолжая расширять линейку умных планшетов и многофункциональных устройств, компания Blackview представляет MEGA 5 — 12,2-дюймовый AI-планшет, который идеально сочетает в себе развл...
    Читать дальше
  • Dell представила свою альтернативу MacBook Neo за те же деньги (3 фото)

    Компания Dell выпустила новый ноутбук XPS 13, который метит в ту же нишу, что и Apple MacBook Neo. Компактная 13,4-дюймовая модель с высоким разрешением экрана, весом менее 1 кг и короткоходной клавиатурой позиционируется как устройство для повседневной работы и учёбы.
    Читать дальше
  • Представлен Surface Laptop Ultra — это самый мощный ноутбук Microsoft, и он получил процессор Nvidia RTX Spark (4 фото)

    Когда-то Microsoft была вынуждена списать $900 млн, поверив в то, что Arm-чип Nvidia станет основой первого флагманского портативного устройства с Windows в семействе Surface. Теперь же софтверный гигант предпринимает новую попытку — широкой публике представили Surface Laptop Ultra — флагманский ноутбук на базе Arm-чипов от Nvidia.
    Читать дальше
  • Huawei показала чип с 2D-транзисторами — это шанс догнать TSMC без EUV-литографии

    На днях исследователи из Huawei совместно с командой Нанкинского университета в журнале Nature Electronics опубликовали работу, в которой сообщили о создании RISC-процессора с использованием 2D-материалов. В перспективе это поможет добиться рекордной плотности размещения транзисторов без использования передовых подсанкционных литографов A...
    Читать дальше
  • Microsoft проигнорировала баги Windows, а потом пригрозила уголовным делом исследователю за их публикацию

    Microsoft пригрозила уголовным преследованием независимому исследователю, который опубликовал код эксплойтов для использования уязвимостей в Windows после того, как компания проигнорировала его предупреждения о найденных багах. Исследователь заявил, что техногигант заблокировал ему доступ к порталу для отправки отчётов, что вынудило его р...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 040 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.