• В работе Telegram произошёл очередной сбой — на этот раз глобальный

    Очередной сбой наблюдается в работе службы мгновенных сообщений Telegram — на проблемы с мессенджером жалуются пользователи из разных стран мира, в том числе из США и Европы. Сложности дают о себе знать второй день подряд.
    Читать дальше
  • Робот AheadForm F1 пугающе точно копирует мимику людей (видео)

    Китайская компания AheadForm представила обновлённого робота F1. Видео с демонстрацией его возможностей быстро разошлось по сети. Многие обратили внимание, что мимика у машины пугающе реалистична.
    Читать дальше
  • В последние дни в Москве взлетел спрос на пейджеры, радиостанции и стационарные телефоны

    На фоне проблем со связью и мобильным интернетом в Москве и некоторых других городах России, в столице с 6 по 10 марта оборот бытовых радиостанций вырос на 27 %, пейджеров — на 73 %, стационарных телефонов — на четверть, пишет BFM.ru со ссылкой на статистику маркетплейса Wildberries.
    Читать дальше
  • UGREEN выпустила на российский рынок три новых модели наушников (5 фото)

    На российском рынке стали доступны три модели беспроводных наушников UGREEN: HiTune H6 Magic с уникальным сенсорным дисплеем на кейсе, ClipBuds Pro с трендовой открытой конструкцией-клипсой для спорта и бюджетные UGREEN HiTune A3 в классическом дизайне.
    Читать дальше
  • Нейронный рендеринг в DLSS 5 оказался больше похож на ИИ-фильтр (видео)

    Анонсированное компанией Nvidia на конференции GTC 2026 интеллектуальное масштабирование DLSS 5 вызвало стойкое отторжение среди геймеров, ценящих художественный замысел своих любимых игр.
    Читать дальше

Наушники с чипом Apple M2 переводят речь сразу нескольких людей (видео)

19 мая 2025 | Просмотров: 2 565 | Гаджет новости

Исследователи из Вашингтонского университета разработали наушники с искусственным интеллектом, способные в режиме реального времени переводить речь нескольких людей, говорящих на разных языках. Система получила название «Пространственный речевой перевод» и использует бинауральные наушники, имитирующие восприятие звука человеческими ушами.

В отличие от существующих решений, способных обрабатывать только один аудиопоток, новая технология позволяет распознавать и переводить голоса нескольких говорящих одновременно. Это открывает возможности для использования в шумных местах, например, на конференциях или в барах, где люди общаются на разных языках.


В основе технологии лежит комбинация разделения источников звука, локализации, перевода и бинаурального рендеринга, работающая в реальном времени на процессоре Apple M2. Микрофоны фиксируют направление речи, а ИИ обрабатывает каждый голос отдельно, сохраняя его локализацию и громкость. Прототип работает локально без отправки данных в облако и сохраняет естественный тембр речи носителей.

Наушники тестировались как в помещении, так и на улице. Система переводит речь с задержкой в 2–4 секунды, причём пользователи предпочитают задержку в 3–4 секунды для лучшего восприятия. Пока поддерживаются испанский, немецкий и французский языки, но разработчики планируют расширить этот список.

Код проекта доступен для открытого использования, что позволяет сообществу разработчиков совершенствовать технологию. По слухам, Apple также работает над аналогичной системой для AirPods.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.