• Блогер сравнил влияние типа накопителя на работу ПК (видео)

    Автор YouTube-канала Dawid Does Tech Stuff решил наглядно показать, насколько сильно тип накопителя влияет на работу компьютера. Для эксперимента он протестировал одну и ту же систему с четырьмя разными устройствами хранения данных: современным NVMe SSD, далеко не самым новым SATA SSD, жёстким диском на 7200 оборотов в минуту и ноутбуч...
    Читать дальше
  • Китай создал фотонный квантовый компьютер, который суперкомпьютерам не догнать даже за время жизни Вселенной

    Китайские учёные создали новую версию фотонного квантового компьютера «Цзючжан» (Jiuzhang), впервые представленного шесть лет назад. Это уже четвёртая реализация системы, с возросшей на порядок мощностью. В 2020 году «Цзючжан 1.0» намекал на достижение квантового превосходства в синтетических бенчмарках. Новая система за доли секунды в...
    Читать дальше
  • Операторы связи договорились принудительно переводить россиян на уведомления в мессенджере Мах

    «Билайн», МТС, «МегаФон» и Т2 подписали стратегические соглашения с национальным мессенджером «Макс» о технологическом взаимодействии, сообщают в VK. Сотрудничество предполагает использование мессенджера для отправки пользователям авторизационных, сервисных и транзакционных сообщений. Пользователи смогут получать в «Макс» коды подтверж...
    Читать дальше
  • Google представил масштабное обновление Android Auto (3 фото)

    Компания Google рассказала о комплексном обновлении ПО для автомобильных систем, затрагивающем как платформу Android Auto, так и транспортные средства со встроенными сервисами Google. Новые функции будут постепенно добавляться на совместимые машины в течение 2026 года.
    Читать дальше
  • Google объявила, что Android-смартфоны массово научатся передавать файлы на iPhone через AirDrop

    В ноябре прошлого года Google обеспечила поддержку передачи файлов на iPhone с помощью AirDrop для смартфонов серии Pixel 10. Сегодня Google объявила о планах добавить поддержку AirDrop через Quick Share на устройства своих партнёров по экосистеме Android, включая Oppo, OnePlus, Vivo, Xiaomi и Honor.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 850 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.