Российский разработчик речевых технологий Neuro.net выпустил два новых SaaS сервиса:
- ASRaaS – автоматическое распознавание речи в облаке.
- TTSaaS – генерация речи в облаке.
Для чего нужен ASRaaS?
Сервис ASRaaS (Automatic Speech Recognition as a Service) в режиме реального времени распознает (переводит в текст) естественную речь и аудиофайлы. ASRaaS используется для автоматизации работы колл-центров, создания голосовых роботов, ассистентов, голосового управления. На вход ASRaaS получает аудио, а на выходе предоставляет текст для дальнейшей работы с ним стороних программ.
Для чего нужен TTSaaS?
Сервис синтеза речи TTSaaS (Text-to-Speech as a Service) используется для преобразования текста в речь. Это компьютерное моделирование человеческой речи из текстового представления при помощи методов машинного обучения. Обычно синтез речи используется для создания цифровых роботов, голосовых ассистентов и озвучки различного контента: видео, аудиокниг, игр, метавселенных. Создание сгенерированного голоса обходится значительно дешевле использования студийной записи профессиональных дикторов.
Почему в облаке?
Как начать пользоваться сервисами?
Neuro.net традиционно разрабатывала корпоративные B2B решения, адаптируемые под каждого заказчика. Классические продукты Neuro ASR и TTS достигли высокого качества и используются крупнейшими телеком операторами, такими как ТЕЛЕ2. Облачные ASRaaS и TTSaaS являются эволюцией классических речевых технологий Neuro.net.
«Теперь распознавание и синтез речи доступны любым пользователям, а не только избранным корпоративным клиентам. При этом «под капотом» новых сервисов те же производительность и качество передовых Neuro ASR и TTS», — сказал операционный директор Neuro.net Денис Непомнящий.
Таким образом, любой разработчик программного обеспечения: будь то стартап, разрабатывающий голосового бота, или ИТ-отдел крупной компании, автоматизирующий колл-центр, может начать самостоятельно использовать ASR и TTSaaS через интеграцию сервисов в облачном аккаунте.
Быстро ознакомиться с возможностями распознавания и синтеза речи можно на speech.neuro.net, где можно протестировать распознавание речи с микрофоном и синтезировать речь из текста с использованием различных голосов.
Чтобы начать использование ASRaaS и TTSaaS, необходимо посетить сайт speech.neuro.net, зарегистрировать аккаунт и следовать инструкциям. Сервисы предоставляют 14-дневный бесплатный период для тестирования.
Документация по сервисам представлена по ссылке. В документации можно найти подробную информацию о том, как интегрировать сервисы в продукты пользователей с помощью API.
О компании Neuro.net
Neuro.net – эксперт на рынке голосовых технологий в России. C 2017 года разрабатываем собственные прорывные технологии в области голосового ИИ. Мы стремимся делать речевые технологии доступными для всех, предоставляя инструменты, которые помогут вам автоматизировать и улучшить работу с голосовыми данными.