• Пятьдесят лет назад AMD создала свой первый процессор AM9080, который обходился в 50 центов, но продавался за $700

    Уходящий год для истории AMD характеризуется «юбилеем» первого x86-совместимого процессора AM9080, который являлся клоном конкурирующего Intel 8080, но уже тогда превосходил его по техническим характеристикам. Кроме того, затраты AMD на выпуск одного такого процессора составляли 50 центов, а продавать его она могла за $700.
    Читать дальше
  • Терминалы Starlink превратятся в «кирпичи», если не обновить ПО до 17 ноября

    Компания SpaceX предупредила пользователей спутникового интернета Starlink, приостановивших или отменивших подписку, что им необходимо обновить программное обеспечение своих терминалов до 17 ноября, иначе устройства перестанут функционировать. Об этом сообщается в рассылке компании и на официальной странице поддержки Starlink, сообщает...
    Читать дальше
  • Потенциально обитаемая экзопланета обнаружена всего в 18 световых годах от Земли

    Учёные из Университета Калифорнии в Ирвине объявили об обнаружении экзопланеты GJ 251c — супер-Земли, расположенной всего в 18 световых годах от Солнечной системы. Это одна из ближайших к нам планет, потенциально пригодных для жизни. В каталоге из тысяч уже открытых экзопланет подобная находка — это невероятно редкий экземпляр, научную...
    Читать дальше
  • Китайцы построили суперкомпьютер размером с холодильник, работающий по аналогии с человеческим мозгом

    Первые компьютеры в первой половине прошлого века занимали огромные площади, с появлением современных суперкомпьютеров ситуация не особо улучшилась, но китайским разработчикам удалось создать компактный и экономичный суперкомпьютер, который по размерам сопоставим с небольшим бытовым холодильником.
    Читать дальше
  • Дипфейковый Хуанг стал популярнее настоящего — трансляция Nvidia GTC от мошенников собрала в пять раз больше зрителей (3 фото)

    Ничего не подозревающие зрители YouTube, ожидавшие во вторник основного доклада Nvidia в рамках конференции GTC 2025, вполне могли случайно увидеть сгенерированный искусственным интеллектом дипфейк с Дженсеном Хуангом, рекламирующим мошенническую схему с криптовалютой. Платформа YouTube разместила это видео в трендах выше настоящей тра...
    Читать дальше

Китайцы представили нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь (видео)

1 марта 2024 | Просмотров: 16 220 | Новости IT

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).


В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.