Есть ли способ отправить аудиофайл в распознавание речи на текст

Я хочу, чтобы система распознавания речи Android анализировала аудиофайл, а не входящий голос по умолчанию из микрофона.

Ответы

Ответ 1

Я полагаю, что он работает аналогично chrome api - http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/

Как он упомянул, вы можете преобразовать файл микрофона в файл .flac и отправить его в речь api, и вы получите тот же результат. Таким образом, вы можете использовать SOX и преобразовать его самостоятельно.

Надеюсь, это поможет. Dias

Ответ 2

cmusphinx.sourceforge.net/wiki/tutorialandroid Просто нашел, что ссылка звучит так, как будто кто-то создал версию Sphinx для Android.

Глядя на Android, api делает это, похоже, не поддерживается. (http://developer.android.com/reference/android/speech/package-summary.html)

Возможно, вы сможете использовать другой API.

Я знаю, что Microsoft С# api позволяет это, но для того, чтобы это было полезно, вам, вероятно, потребуется настроить сервер с программой, которую вы написали, записываете звуковой файл на телефон, а затем отправляете его на сервер.

CMUSphinx (http://cmusphinx.sourceforge.net/wiki/) написан на Java, поэтому возможно его запуск на устройстве Android. На этом api вы создаете StreamSpeechReconizer.

StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(configuration);
recognizer.startRecognition(new File("speech.wav").toURI().toURL());
SpeechResult result = recognizer.getResult();
recognizer.stopRecognition();

Я нашел этот https://gist.github.com/alotaiba/1730160 с быстрым веб-поиском (google "распознавание речи api принимает файл" ), поэтому могут быть доступны другие службы в Интернете, который будет принимать файл, который будет отправлен им.