• Microsoft показала нейросеть, которая делает говорящими что угодно (2 фото + видео)

    За последние пару лет генеративные нейросети преодолели важный этап развития, став более мощными и способными создавать по текстовому описанию не только изображения, но и видео. Новый алгоритм VASA-1 от Microsoft, вероятно, сумеет удивить многих, поскольку для его работы вообще не нужно описание. Достаточно предоставить одно изображение ч...
    Читать дальше
  • Гражданский сверхзвуковой самолёт Boom Supersonic допустили к испытательному полёту (видео)

    Стартап Boom Supersonic сообщил, что Федеральное управление гражданской авиации (FAA) выдало разрешение на первый полёт демонстратора XB-1 с превышением скорости звука. Полёт состоится в неопределённом будущем на базе ВВС США «Эдвардс» по двум утверждённым коридорам. Первый полёт с преодолением скорости звука станет авансом разработчикам ...
    Читать дальше
  • Корабль Boeing Starliner подготовлен к первому испытательному полёту с экипажем к МКС (5 фото)

    Наземный персонал «Космического побережья» Флориды на этой неделе пристыковал космический корабль Boeing Starliner к ракете United Launch Alliance Atlas V, начав подготовку к запуску в следующем месяце. Этот полёт станет первым пилотируемым стартом Starliner после двух испытательных пусков без экипажа в 2019 и 2022 годах. Предстоящий запу...
    Читать дальше
  • Анонсированы банковские карты с OLED-экраном (2 фото)

    Американская компания Sentry Enterprises приступила к выпуску необычных банковских карт серии Radiance, оснащённых встроенными OLED-панелями. Разработчики раскрыли первые подробности о необычном платёжном средстве и рассказали, в чём заключаются его преимущества для банков и их клиентов.
    Читать дальше
  • ИИ-диктофон с функцией конспектирования аудио оценили в $99 (видео)

    Стартап Limitless выпустил необычное носимое устройство под названием Pendant. Гаджет записывает все окружающие звуки, а затем структурирует их с помощью ИИ-алгоритма и составляет «конспект», который может помочь пользователю воспроизвести любой момент прошедшего дня.
    Читать дальше

ИИ от Microsoft обогнала конкурента IBM Watson в распознавании речи

22 августа 2017 | Просмотров: 9 748 | Интересное / Новости IT
ИИ от Microsoft обогнала конкурента IBM Watson в распознавании речи

Прошло чуть больше полугода с тех пор, как представленная Microsoft система распознавания речи сравнялась по показателям ошибок с профессиональным стенографистом — человеком (уровень ошибок составляет 5,9%). Однако разработчики Microsoft не прекратили работу в этом направлении и уже сейчас презентовали очередной успех системы. Теперь она выдаёт всего 5.1 % ошибочных слов при расшифровке речи. Таким образом, можно смело утверждать, что ИИ превзошёл возможности человека.

Увеличение точности распознавания человеческой речи, произошедшее за последний год в Microsoft, превысило 12 процентов. В результате усовершенствований нейронная сеть смогла анализировать даже контекст сказанного человеком, прогнозировать будущие слова или даже фразы. Данное достижение значительно повысило эффективность расшифровки аудиозаписи в автоматическом режиме. Тестирование нейросети Microsoft осуществляется в рамках программы Switchboard, предусматривающей распознавание речи по 2400 ранее записанным телефонным разговорам, преимущественно на общие темы.

Уровень ошибки в 5.1 %, достигнутый ИИ, соответствует результативности работы нескольких экспертов-людей, прослушавших записанный фрагмент несколько раз и обсуждавших услышанный текст между собой. Использование столь высоких достижений нейронной сети может быть применено для улучшения работы голосового помощника Cortana или в офисном пакете Microsoft для презентаций на нескольких языках.

Показав уникальный результат точности распознавания речи с ошибкой всего в 5.1 %, Microsoft опередила ближайшего конкурента – компанию IBM, которая на своей системе Watson показывала результат в 5.5%. Разработчики из Microsoft не собираются останавливаться на достигнутом. Следующим этапом будет улучшение восприятия голоса при наличии акустических помех, шумов, совершенствование способности распознавания речи с акцентом или расшифровки диалектов. Кроме того, специалисты поставили главную цель — умение ИИ понимать сказанное, а не просто автоматически переводить речь человека.

Источник: Microsoft


Комментарии: 2

  1. SES®
    22 августа 2017 11:42 SES®
    Мечта спецслужб - слушать конкретный разговор в толпе людей без "засланного казачка" с микрофоном на груди.
    + 2
    Ответить
  2. Iliri
    22 августа 2017 21:18 Iliri
    Сколько ресурсов при этом требуется сейчас, чтобы поддерживать работу машины и программы?
    + 1
    Ответить
В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.