Синхронизация текста и звука. Есть ли библиотека NLP/речи для текста?
Я хотел бы синхронизировать произносимую запись с известным текстом. Есть ли библиотека обработки речи/текста/естественного языка, которая бы облегчила это? Я предполагаю, что хочу определить границы слов и вычислить совпадения кандидатов из словаря. Большинство вопросов, которые я нашел на SO, касаются письменного языка.
Требуется, но не требуется:
- Открытый исходный код
- Совместимость с американским английским готовым
- Кросс-платформенная
- Тщательно документированный
Редактировать: Я понимаю, что это очень широкий, даже наивный вопрос, поэтому заранее заблаговременно для вашего руководства.
Что я нашел до сих пор:
Ответы
Ответ 1
Принудительное выравнивание
Похоже, вы хотите сделать принудительное выравнивание между вашим аудио и известным текстом.
Практически все исследовательские/отраслевые системы распознавания речи смогут это сделать, поскольку принудительное выравнивание является важной частью обучения системы распознавания данных, которые не имеют phone выравнивание уровня между аудио и транскрипцией.
Выравнивание CMUSphinx
Sphinx4-1.0 beta 5 release системы распознавания речи с открытым исходным кодом CMU теперь включает в себя демонстрацию о том, как сделать выравнивание между расшифровкой и длинной речевые записи.