Yandex SpeechKit для поддержки — голосовой бот за неделю
Принимаем звонки, распознаём, отвечаем синтезированным голосом. SpeechKit держит уровень в 2026, цена приемлемая.
SpeechKit — облачный сервис распознавания и синтеза речи от Yandex Cloud. STT (speech-to-text) и TTS (text-to-speech) через REST или gRPC.
Реальные цифры: распознавание ~0.18 руб/секунда, синтез ~0.20 руб/тысячу символов. Звонок на 3 минуты = ~30 руб.
Для голосового бота: SIP-провайдер → SpeechKit STT → ваш скрипт → SpeechKit TTS → SIP обратно.
Качество распознавания русского — лучше чем у Whisper для российских акцентов и фоновых шумов. Для английского лучше Whisper или Deepgram.