• В работе Telegram произошёл очередной сбой — на этот раз глобальный

    Очередной сбой наблюдается в работе службы мгновенных сообщений Telegram — на проблемы с мессенджером жалуются пользователи из разных стран мира, в том числе из США и Европы. Сложности дают о себе знать второй день подряд.
    Читать дальше
  • Робот AheadForm F1 пугающе точно копирует мимику людей (видео)

    Китайская компания AheadForm представила обновлённого робота F1. Видео с демонстрацией его возможностей быстро разошлось по сети. Многие обратили внимание, что мимика у машины пугающе реалистична.
    Читать дальше
  • В последние дни в Москве взлетел спрос на пейджеры, радиостанции и стационарные телефоны

    На фоне проблем со связью и мобильным интернетом в Москве и некоторых других городах России, в столице с 6 по 10 марта оборот бытовых радиостанций вырос на 27 %, пейджеров — на 73 %, стационарных телефонов — на четверть, пишет BFM.ru со ссылкой на статистику маркетплейса Wildberries.
    Читать дальше
  • UGREEN выпустила на российский рынок три новых модели наушников (5 фото)

    На российском рынке стали доступны три модели беспроводных наушников UGREEN: HiTune H6 Magic с уникальным сенсорным дисплеем на кейсе, ClipBuds Pro с трендовой открытой конструкцией-клипсой для спорта и бюджетные UGREEN HiTune A3 в классическом дизайне.
    Читать дальше
  • Нейронный рендеринг в DLSS 5 оказался больше похож на ИИ-фильтр (видео)

    Анонсированное компанией Nvidia на конференции GTC 2026 интеллектуальное масштабирование DLSS 5 вызвало стойкое отторжение среди геймеров, ценящих художественный замысел своих любимых игр.
    Читать дальше

Нейросеть Nvidia научили создавать видео из текста

20 апреля 2023 | Просмотров: 9 440 | Новости IT
Нейросеть Nvidia научили создавать видео из текста

NVIDIA в сотрудничестве с исследователями из Корнельского университета представила VideoLDM - модель ИИ, способную генерировать видео высокого разрешения до 2048×1280 p. с частотой 24 кадра/с и продолжительностью 4,7 секунды на основе текстовых описаний.

Модель основана на технологии нейронной сети Stable Diffusion и имеет до 4,1 миллиарда параметров, что делает ее одним из самых продвинутых генераторов текста в видео. VideoLDM также может генерировать видео длиной до 5 минут в разрешении 1024×512 для сценариев вождения, используя одно фото. Кроме того, VideoLDM может предсказать несколько правдоподобных вариантов сценария вождения на основе того же кадра.

ИИ-модель NVIDIA VideoLDM может быть использована в различных приложениях, включая кино и телепроизводство и разработку видеоигр.

Посмотреть примеры видеороликов можно на официальном сайте nVidia

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.