Мигрируй в Cloud — получи до 80 часов консультаций с нашими лучшими инженерами и до 2 месяцев бесплатного тестового периода
by sberdevices

SmartSpeech

Распознавание и синтез речи — удобный интерфейс взаимодействия с вашим продуктом
Shape

SmartSpeech позволяет бизнесу без специального оборудования подключать речевые технологии

1

Предоставляется программный интерфейс (API) для подключения и использования речевых сервисов в продуктах

2

API использует протоколы HTTP и gRPC, поэтому код можно очень быстро встроить практически в любую систему

3

Использование HTTP REST и gRPC API удобно, когда у бизнеса есть собственная интеграция, например, клиент для телефонной платформы

Преимущества

Собственная GPU-based система распознавания речи с уникальными декодером и акустической моделью

Мощный комплекс нормализации текста

Цифры, адреса, названия и многое другое

Высокая скорость работы

Возможность использовать хинты

Подсказки для сервиса распознавания речи помогают правильно понять речь пользователя в определённый момент и ускорить реакции системы

Несколько дикторов

Библиотека голосов постоянно пополняется

Уникальные модели расстановки ударений, буквы «ё»

Определение тишины, шума, конца высказывания, эмоций спикера, расстановка знаков препинания

Сценарии использования

1

Синтез речи

Примените в чатах, инструкциях и описаних
2

Голосовой ввод

Позвольте клиентам использовать голос, а не текст
3

Интерактив в меню

Эффективная оптимизация работы колл-центра
4

Телемаркетинг

Экономьте, отказавшись от услуг операторов
Icon

Синтез речи

Пользователи приложения или сайта не только видят, но и слышат контент. Используйте синтез речи в чатах, инструкциях и описании продукта.

Очень легкое подключение

Наш API использует протоколы HTTP и gRPC. Вы сможете быстро встроить код в свои системы

Посмотрите, как круто это работает

Синтез речи
Распознавание речи
Наталья
Борис
Марфа
Тарас
74 / 200 символов
Выберите голос, введите текст и нажмите «Синтезировать».
Чтобы изменить ударение, используйте символ ' после ударной гласной
Полная функциональность синтеза речи с использованием SSML-разметки и распознавания речи с использованием хинтов доступна после регистрации при подключении к сервису в AI Services

GOLOS: 1240 часов аудиоданных

Самый большой размеченный вручную датасет из 1240 часов аудиоданных на русском языке и обученная на них модель распознавания речи
Shape

Попробуйте сервис бесплатно

Создайте свой первый проект с сервисом SmartSpeech

Остались вопросы?

Задайте вопросы специалистам службы поддержки SmartSpeech