• Илон Маск раскрыл первые подробности об ИИ-спутнике AI1

    В ходе нового интервью Илон Маск рассказал о спутнике AI1 для выполнения ИИ-вычислений прямо на орбите. Глава SpaceX также затронул темы ракет Starship, фабрики по производству чипов и будущей инфраструктуры для искусственного интеллекта.
    Читать дальше
  • Экраноплан WaveFly 5X может парить прямо над водой (видео)

    Китайская компания NAVEE представила необычное транспортное средство под названием WaveFly 5X. Новинка способна скользить над поверхностью воды, создавая ощущение низкого полёта.
    Читать дальше
  • В устройствах Apple с чипами A12 и A13 найдена неустранимая уязвимость, подходящая для джейлбрейка

    Исследователи безопасности из Paradigm Shift опубликовали технические детали новой, неустранимой, по их утверждению, уязвимости BootROM, получившей название usbliter8. Данный эксплойт базируется на недостатках оборудования и позволяет выполнять произвольный код на устройствах компании Apple, оснащённых процессорами поколений A12 и A13.
    Читать дальше
  • Telegram через суд обжаловал блокировку в Индии

    Администрация мессенджера Telegram подала в суд в Нью-Дели иск, в котором оспорила распоряжение властей страны о временной блокировке платформы в целях предотвращения мошенничества на экзаменах.
    Читать дальше
  • Commodore анонсировала кнопочный смартфон-раскладушку за $499 (3 фото)

    Когда новым руководителем остатков легендарной Commodore стал энтузиаст ретротехники Кристиан Симпсон (Christian Simpson), было принято решение, что компания начнёт двигаться вперёд с того места, на котором остановилась оригинальная Commodore. В результате на рынке появились портативные консоли, вдохновлённые легендарной Commodore 64. Теп...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 160 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.