ASR as a Service – сервис автоматического распознавания
речи в облаке
Автоматически распознает живую речь и аудиофайлы, переводит их в текст. Работает в режиме реального времени.
Попробовать в облаке
Запись №10857 в реестре российского ПО
• работа с потоковым аудио в режиме реального времени. Ответ сервиса – не более 100 мс;
• автоматическая разметка текста на выходе, в т.ч. расстановка знаков препинания;
• настройки транскрипции числовых значений цифрами или буквами с учетом падежа («500, пятисотый, пятисот»).
Возможности
• низкий WER (word error rate) – не более 0,125;
• распознавание речи без шума. Нейросеть отделяет голос собеседника от разговоров других людей на фоне или шума улицы;
• способность распознавать тихую речь.
Высокое качество распознавания
Определяем характеристики аудио
• распознаем аудио (гудки, автоинформатор, шум и др.) автоответчиков и голосовых ассистентов;
• пол собеседника;
• возрастная категория (взрослый, ребенок);
• классифицируем зашумленные аудио.
• имена и названия;
• числа;
• даты, дни недели;
• время: «вчера вечером» или «вторая половина дня»;
• адреса аббревиатуры: «ИП», «ООО»;
• специфические слова и обозначения: «X5Retail Group», «криптовалюта», «брокерский счет».
*модуль распознавания и классификации NER подключается отдельно
Распознаем сущности*
Особенности сервиса
В нашем сервисе применяются новейшие разработки в голосовом ИИ, которые обеспечивают исключительную точность и скорость работы.
Автоматизация колл центров
ASR используется для автоматизации обработки входящих и исходящих звонков, распознавания речи клиентов и направления их запросов на соответствующие отделы или услуги. Также для аналитики качества работы операторов.
Транскрибация аудио
Создание систем автоматической транскрибации видео, лекций, а также для разработки интерактивных обучающих приложений.
Ассистенты, голосовой поиск и меню
ASR используется для создания голосовых помощников в приложениях для онлайн-покупок, обработки голосовых команд от пользователей и предоставления информации о товарах или услугах.
Голосовое управление
ASR интегрируется в системы голосового управления в автомобилях, позволяя водителям безопасно управлять навигацией, мультимедийными системами и другими функциями, не отвлекаясь от дороги.
Сферы применения ASR
Выгоды использования ASRaaS
Быстрый запуск
Интегрируйте готовое решение ASR/TTS в ваш продукт и выводите его на рынок раньше конкурентов.
Масштабирование
ASR способен обрабатывать большие объемы данных: за год через наш ASR проходит более 250 млн. минут трафика.
Прозрачный биллинг
Вы видите статистику использования сервиса в реальном времени. Удобно планировать бюджет, следить за расходами и оплачивать.
Настройка под свою предметную область*
За счет дообучения нейросети можно настроить решение под свою уникальную область знаний. *Услуга предоставляется отдельно
Российская разработка
Наша офисы и серверы расположены в РФ. ПО зарегистрировано в реестре Минцифры.
На какие показатели влияет качество
и скорость распознавания речи
Time-to-Market –
ускоряет выход продукта на рынок за счет быстрой интеграции готового решения по автоматическому распознаванию речи.
Процент конверсии звонков, доля обращений, решенных без участия человека –
за счет правильного распознавания ответов собеседников.
Время работы редакторов при транскрибации речи –
за счет правильного распознавания и расстановки знаков препинания.
Точность определения параметров заявки –
за счет распознавания имен, адресов, времени.
Интеграция и документация
Интегрируйте Neuro ASR/
TTSaaS в ваш продукт через
API Websocket и REST.
Документация к сервису подробно описывает процесс интеграции.
Ведущие компании уже используют речевые технологии Neuro.net
О компании Neuro.net
Neuro.net – эксперт на рынке голосовых технологий в России. C 2017 года разрабатываем собственные прорывные технологии в области голосового ИИ.
Российская разработка
Наши офисы и серверы расположены в РФ. ПО зарегистрировано в реестре Минцифры.
Стоимость
0,33 руб. за минуту распознавания.
Бесплатный тестовый период
Получите 14 дней и 100 руб. на баланс для распознавания речи.