Есть ли способ отправить аудиофайл в распознавание речи на текст
Я хочу, чтобы система распознавания речи Android анализировала аудиофайл, а не входящий голос по умолчанию из микрофона.
Есть ли способ сделать это?
Спасибо.
Ответы
Ответ 1
Я полагаю, что он работает аналогично chrome api - http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/
Как он упомянул, вы можете преобразовать файл микрофона в файл .flac и отправить его в речь api, и вы получите тот же результат. Таким образом, вы можете использовать SOX и преобразовать его самостоятельно.
Надеюсь, это поможет.
Dias
Ответ 2
cmusphinx.sourceforge.net/wiki/tutorialandroid Просто нашел, что ссылка звучит так, как будто кто-то создал версию Sphinx для Android.
Глядя на Android, api делает это, похоже, не поддерживается. (http://developer.android.com/reference/android/speech/package-summary.html)
Возможно, вы сможете использовать другой API.
Я знаю, что Microsoft С# api позволяет это, но для того, чтобы это было полезно, вам, вероятно, потребуется настроить сервер с программой, которую вы написали, записываете звуковой файл на телефон, а затем отправляете его на сервер.
CMUSphinx (http://cmusphinx.sourceforge.net/wiki/) написан на Java, поэтому возможно его запуск на устройстве Android. На этом api вы создаете StreamSpeechReconizer.
StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
recognizer.startRecognition(new File("speech.wav").toURI().toURL());
SpeechResult result = recognizer.getResult();
recognizer.stopRecognition();
Я нашел этот https://gist.github.com/alotaiba/1730160 с быстрым веб-поиском (google "распознавание речи api принимает файл" ), поэтому могут быть доступны другие службы в Интернете, который будет принимать файл, который будет отправлен им.