Существует ли API для технологии распознавания речи Google?

Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как "следующий" или "предыдущий". Есть ли способ использовать распознавание голоса Google? Я знаю о Chrome x-webkit-speech, но я должен нажать кнопку, чтобы использовать его.

Я пробовал MIT WAMI, но я нашел его более медленным и менее точным, чем речевое познание Google.

Ответы

Ответ 1

На сегодняшний день это теперь существует, для Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html

(api doc)

Ответ 2

Для простого способа сделать это с помощью JavaScript, проверьте annyang, который является библиотекой, которая упрощает работу с распознаванием речи.

Ответ 3

Проблема заключается в том, что захватит вашу речь пользователя и отправит на него какой-то речевой сервер для обработки. x-webkit-speech встроена в браузер, и браузер использует звуковую карту ПК для записи речи. Javascript/Jquery в браузере не может получить доступ к аппаратным устройствам. Я не знаю, показывает ли Chrome любые объекты x-webkit-speech в DOM, поэтому вы можете выполнять захват через Javascript.

Тем не менее, люди реверсировали речевую речь api и использовали ее из кода. См. http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ для примера.

Ответ 4

Я нашел это, я лично не использовал его, я не знаю, полностью ли это то, что вы ищете, но посмотрите.

http://captico.com/introducing-speech-2-text-api-by-google/2011/03