• Недешёвый игровой ПК Steam Machine оказался близок к себестоимости

    Valve объявила цену ПК Steam Machine — она составляет от $1049. Это почти вдвое дороже Sony PlayStation 5, но это и не консоль, а полноценный ПК, к тому же достаточно компактный. Компания уверяет, что продаёт его почти по себестоимости, и журналисты The Verge подтвердили этот тезис, подобрав схожие комплектующие.
    Читать дальше
  • В NASA испытали «шагающий» ровер — он карабкается на скалы и ездит «крабиком» (видео)

    В калифорнийской пустыне Колорадо инженеры NASA испытали экспериментальный четырёхколёсный ровер ERNEST (Exploration Rover for Navigating Extreme Sloped Terrain), созданный в JPL. Машина длиной около 1,2 м служит испытательным стендом для технологий, которые в будущем могут лечь в основу луноходов и марсоходов с существенно увеличенным пр...
    Читать дальше
  • Ford вернул уволенных инженеров для исправления ошибок, которые наделал ИИ

    Компания Ford была вынуждена вернуть в штат бывших инженеров для устранения недочётов, допущенных автоматизированными системами проектирования и производства. Руководство признало, что излишняя ставка на искусственный интеллект без учёта накопленного человеческого опыта привела к снижению надёжности выпускаемых авто и рекордному росту чис...
    Читать дальше
  • Apple удалила приложения ВК из AppStore

    Теперь у тех, кто успел установить приложения пропадут уведомления, а остальные пользователи "яблока" вообще не смогут скачать сервисы.
    Читать дальше
  • Зум-камеры в смартфонах начнут снимать чётче — представлен сенсор Sony LYTIA 610 со структурой RB2×2 OCL (3 фото)

    Sony анонсировала 64-мегапиксельный 1/2-дюймовый сенсор LYTIA 610 для мобильных устройств. Это первый в своём роде серийный компонент, имеющий пиксельную структуру RB2×2 On-Chip Lens (OCL), которая обеспечивает чёткое изображение и точное срабатывание функции автофокусировки.
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 17 210 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.