Ответ 1
На сегодняшний день это теперь существует, для Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html
(api doc)
Я хочу попробовать создать слайд-шоу jQuery, используя простые голосовые команды, такие как "следующий" или "предыдущий". Есть ли способ использовать распознавание голоса Google? Я знаю о Chrome x-webkit-speech, но я должен нажать кнопку, чтобы использовать его.
Я пробовал MIT WAMI, но я нашел его более медленным и менее точным, чем речевое познание Google.
На сегодняшний день это теперь существует, для Chrome: http://chrome.blogspot.co.uk/2013/01/hello-browser.html
(api doc)
Для простого способа сделать это с помощью JavaScript, проверьте annyang, который является библиотекой, которая упрощает работу с распознаванием речи.
Проблема заключается в том, что захватит вашу речь пользователя и отправит на него какой-то речевой сервер для обработки. x-webkit-speech встроена в браузер, и браузер использует звуковую карту ПК для записи речи. Javascript/Jquery в браузере не может получить доступ к аппаратным устройствам. Я не знаю, показывает ли Chrome любые объекты x-webkit-speech в DOM, поэтому вы можете выполнять захват через Javascript.
Тем не менее, люди реверсировали речевую речь api и использовали ее из кода. См. http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ для примера.
Я нашел это, я лично не использовал его, я не знаю, полностью ли это то, что вы ищете, но посмотрите.
http://captico.com/introducing-speech-2-text-api-by-google/2011/03