Получите доступ к записям всех прошедших вебинаров Учиться бесплатно

2589 https://ppc.world/build/resources/img/logo-v2.png ASR помогут расшифровать голосовые сообщения, создать субтитры в видео и удалить посторонние шумы 2022-09-23 ppc.world 160 31 Новость 1

Разработчики смогут бесплатно пользоваться технологиями распознавания речи ВКонтакте

ВКонтакте открыл доступ к собственным технологиям распознавания речи сторонним разработчикам. Технологии распознавания речи (ASR) помогут расшифровать голосовые сообщения, создать субтитры в видео, удалить посторонние шумы в расшифровке и т. д. ASR можно запустить через веб-интерфейс на специальной странице или интегрировать через публичный API ВКонтакте. Об этом сообщается в пресс-релизе компании.

Для распознавания можно выбрать одну из двух моделей:

  • нейтральную, если вам нужно расшифровать разборчивую речь, как в телешоу и интервью;

  • спонтанную, когда нужно обработать более обыденную речь со сленгом.

Нейросеть

Требования к записям, которые могут расшифровать нейросети ВКонтакте:

  • формат MP3, OGG или WAV;

  • длительность — до 100 минут;

  • только русская речь;

  • максимальный размер файла — 100 МБ.

Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.

Подробнее о возможностях подключения ASR и ограничениях — в справке ВКонтакте.

ASR будут полезны для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития. Под капотом у ASR сразу три нейросети:

  • одна отвечает за распознавание речи,

  • вторая подбирает подходящие слова,

  • третья расставляет знаки препинания.

Нейросети ВКонтакте обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».

Александр Тоболь, СТО ВКонтакте, отмечает: «Мы считаем важным помогать рынку и уже делимся широким набором собственных уникальных технологий. Наше ASR-решение — одно из лучших в отрасли по распознаванию обыденной, повседневной речи, в которой нередко встречается сленг, заимствования, сокращения. Каждый месяц пользователи ВКонтакте отправляют более 2 млрд голосовых — это миллионы часов аудио, которые обрабатывают наши нейросети. Применение технологии ограничено только вашей фантазией: можете сделать игру с голосовым управлением или с помощью чат-бота наконец добавить распознавание голосовых в какой-нибудь сторонний мессенджер. Надеемся, что наш ASR поможет появиться новым необычным стартапам и инди-проектам от молодых перспективных разработчиков».

Напомним, что в «Желания» ВКонтакте теперь можно добавлять товары из магазинов соцсети.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: