Самая быстрая библиотека распознавания речи С++
Я знаю его общий вопрос, но все же я хочу знать, какая самая быстрая библиотека распознавания речи в С++?
В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.
Я проверил образец, снабженный кинектом, в котором черепаха движется вправо вправо, согласно признанным словам, но даже немного медленным.
Итак, мне было интересно, есть ли какая-нибудь более быстрая библиотека, а затем sapi, которая может использоваться в таких случаях, как робот с использованием распознавания голоса, который вы говорите "слева", а затем "справа", но робот продолжает двигаться влево и поворачивается сразу после 1,2 секунды его немного расстраивает для пользователя.
Ответы
Ответ 1
Проблема заключается не в быстром, а в правильном способе использования API. Распознавание речи - это трудоемкий процесс, поэтому основной трюк заключается в том, чтобы начать распознавание аудио сразу после записи параллельно с записью. Затем, когда речь заходит о конце фразы, вы получите почти все результаты и можете немедленно отреагировать.
Время ответа 0,2 секунды может быть достигнуто таким образом, но для этого вам потребуется более гибкий API. Хорошим выбором является CMUSphinx, система распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации