Речевое распознавание речи Android: повторный вызов SpeechRecognizer.startListening() не работает на JB 4.1.2
У меня есть служба, в которой я начинаю прослушивание речевого оповещения несколько раз, поэтому у меня может быть сеанс открытого сеанса для того, чтобы пользователь мог говорить. Класс также обрабатывает проблему в желе Bean, где вызывается ERROR_SPEECH_TIMEOUT, если за 5 секунд не будет слышна речь. Так что в основном это работает. Однако, если я неоднократно вызываю функцию распознавания .startListening(распознающий элемент), он бесшумно терпит неудачу, о чем свидетельствует тот факт, что onBeginningOfSpeech() никогда не вызывается в этом случае. Теперь, если я просто не говорю вообще, мой обработчик timewelly Bean будет перезапускать слушателя каждый раз в обязательном порядке. Кажется, он только терпит неудачу после того, как onResults() вызвана, потому что речь БЫЛА услышана. После вызова onResults() распознавание распознавания .startListening(identizerIntent) определенно называется, но, как я уже сказал, ничего не происходит. Когда он терпит неудачу, он случайный, и в Logcat нет ничего, чтобы указать, в чем проблема. Я просто не знаю, что еще попробовать. Надеюсь, один из вас, специалисты по распознаванию речи в Android там видели это раньше...
Минимум: 2,2
Цель: Тестирование на JB: Android 4.1.2
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ (11-01-13)
Обновление 4.3 для моего HTC One определенно решило эту проблему. Теперь моя служба распознавания речи является надежной и точной. Я пропустил хотя бы несколько минут без ошибок. Что касается 4.1.2, то до моего обновления до 4.3 он, казалось, работал лучше (изменил ли Google что-нибудь на их конце?)... Я не знаю, но он все равно пропустил бы некоторые слова, произнесенные и иногда без ошибок, просто прекратите слушать (onBeginningOfSpeech() в этом случае никогда не вызывается). Полагаю, мне просто нужно будет предупредить моих пользователей об Android 4.1.2 в отношении этой проблемы, потому что я дошел до моего кода.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ (09-17-13)
Предположительно, в конце сентября в HTC появится обновление Android (4.3) (http://www.ubergizmo.com/2013/09/htc-one-to-receive-android-4-3-jelly-bean-update-this-september/). Надеемся, что эта проблема будет устранена на этом устройстве. Проблема остается, хотя для моих пользователей приложений, которые работают под управлением Android 4.1.2, и застрял в этой версии некоторое время. Я до сих пор не знаю, что делать в этих случаях, и, надеюсь, это единственная версия Android с этой проблемой. Есть ли способ узнать, сколько устройств работает 4.1.2?
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ (09-15-13)
В этом сообщении здесь: Google voice распознаватель не запускается на Android 4.x. В заявлении автора говорится, что он видит этот вопрос на своем HTC. У меня также есть HTC, который я вижу в этой проблеме (Android 4.1.2). Интересно, уникально ли это для HTC? (или любое устройство под управлением Android 4.1.2). Я не могу подтвердить, так как его трудно проверить на всех последних устройствах под управлением JB. Автор далее утверждает, что его Nexxus с 4.2.2 отлично работает. Может ли кто-нибудь сказать мне, на каком устройстве они видят эту проблему?
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ (9-08-13)
Просто чтобы подтвердить, что с моим кодом нет проблем, я также тестировал это на Android 2.3.3, и мне удалось вызвать onResult() > startListening() 25 раз подряд. При таргетинге на Android 4.1.2 я никогда не смогу пройти 3 или 4 вызова. Я не могу поверить, что никто другой не столкнулся с этой проблемой?
public class VoiceRecogService extends Service
{
protected AudioManager mAudioManager;
protected SpeechRecognizer mSpeechRecognizer;
protected Intent mSpeechRecognizerIntent;
protected RecognitionListener mSpeechRecognizerListner;
//protected final Messenger mServerMessenger = new Messenger(new IncomingHandler(this));
protected volatile boolean mIsListening;
protected volatile boolean mIsCountDownOn;
static final int MSG_RECOGNIZER_START_LISTENING = 1;
static final int MSG_RECOGNIZER_CANCEL = 2;
private int mBindFlag;
private Messenger mServiceMessenger;
private Context m_ctx;
private Handler mHandler = new Handler();
//private boolean m_bReadyForSpeechReceived = false;
@Override
public void onCreate()
{
super.onCreate();
m_ctx = this;
mAudioManager = (AudioManager) getSystemService(Context.AUDIO_SERVICE);
//do not mute beep when speech listening first kicks off
Log.d("TESTING: SPEECH SERVICE: CALL START", "onCreate()");
startListening(false);
}
private void startListening(boolean bMuteSound){
Log.d("TESTING: SPEECH SERVICE: startListening()", mIsListening? "true":"false");
if (bMuteSound==true && Build.VERSION.SDK_INT >= 16)//Build.VERSION_CODES.JELLY_BEAN)
{
// turn off beep sound
mAudioManager.setStreamMute(AudioManager.STREAM_SYSTEM, true);
}
if (!mIsListening)
{
//mSpeechRecognizer.startListening(mSpeechRecognizerIntent);
recognizeSpeechDirectly ();
mIsListening = true;
}
}
/////////////////////////////////////////////////////////////////////////
/**
* lazy initialize the speech recognizer
*/
private SpeechRecognizer getSpeechRecognizer()
{
if (mSpeechRecognizer == null)
{
mSpeechRecognizer = SpeechRecognizer.createSpeechRecognizer(m_ctx);
}
return mSpeechRecognizer;
}
private RecognitionListener getSpeechRecognizerListner()
{
if (mSpeechRecognizerListner == null)
{
mSpeechRecognizerListner = new SpeechRecognitionListener();
}
return mSpeechRecognizerListner;
}
private void recognizeSpeechDirectly()
{
Intent recognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
recognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
// accept partial results if they come
recognizerIntent.putExtra(RecognizerIntent.EXTRA_PARTIAL_RESULTS, true);
recognizeSpeechDirectly(m_ctx,recognizerIntent, getSpeechRecognizerListner(), getSpeechRecognizer());
}
public static void recognizeSpeechDirectly(Context context,
Intent recognizerIntent,
RecognitionListener listener,
SpeechRecognizer recognizer)
{
//need to have a calling package for it to work
if (!recognizerIntent.hasExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE))
{
recognizerIntent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, "com.dummy");
}
recognizer.setRecognitionListener(listener);
recognizer.startListening(recognizerIntent);
}
////////////////////////////////////////////////////////////////////////////
public void stop()
{
if (getSpeechRecognizer() != null)
{
getSpeechRecognizer().stopListening();
getSpeechRecognizer().cancel();
getSpeechRecognizer().destroy();
mIsListening = false;
if (Build.VERSION.SDK_INT >= 16);//Build.VERSION_CODES.JELLY_BEAN)
mAudioManager.setStreamMute(AudioManager.STREAM_SYSTEM, false);
}
}
// Count down timer for Jelly Bean work around
protected CountDownTimer mNoSpeechCountDown = new CountDownTimer(5000, 5000)
{
@Override
public void onTick(long millisUntilFinished)
{
// TODO Auto-generated method stub
}
@Override
public void onFinish()
{
mIsCountDownOn = false;
Log.d("TESTING: SPEECH SERVICE: CALL START", "onFinish()");
startListening(true);
}
};
@Override
public void onDestroy()
{
super.onDestroy();
if (mIsCountDownOn)
{
mNoSpeechCountDown.cancel();
}
if (mSpeechRecognizer != null)
{
mSpeechRecognizer.destroy();
}
}
protected class SpeechRecognitionListener implements RecognitionListener
{
@Override
public void onReadyForSpeech(Bundle params)
{
if (Build.VERSION.SDK_INT >= 16)//Build.VERSION_CODES.JELLY_BEAN)
{
mIsCountDownOn = true;
mNoSpeechCountDown.start();
}
Log.d("TESTING: SPEECH SERVICE", "onReadyForSpeech");
}
@Override
public void onBeginningOfSpeech()
{
// speech input will be processed, so there is no need for count down anymore
if (mIsCountDownOn)
{
mIsCountDownOn = false;
mNoSpeechCountDown.cancel();
}
}
@Override
public void onEndOfSpeech()
{
Log.d("TESTING: SPEECH SERVICE", "onEndOfSpeech");
}
@Override
public void onBufferReceived(byte[] buffer)
{
//Log.d("TESTING: SPEECH SERVICE", buffer + new String(new byte[] {0x63}));
}
@Override
public void onError(int error)
{
if ((error == SpeechRecognizer.ERROR_NO_MATCH)
|| (error == SpeechRecognizer.ERROR_SPEECH_TIMEOUT)){
if (mIsCountDownOn)
{
mIsCountDownOn = false;
mNoSpeechCountDown.cancel();
}
mIsListening = false;
Log.d("TESTING: SPEECH SERVICE: CALL START", "onError()");
startListening(true);
}
}
@Override
public void onEvent(int eventType, Bundle params)
{
}
@Override
public void onPartialResults(Bundle partialResults)
{
}
@Override
public void onResults(Bundle results)
{
//String str = new String();
//Log.d(TAG, "onResults " + results);
ArrayList data = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
//if(data.size() >=1){
// //check for save it:
//}
for (int i = 0; i < data.size(); i++)
{
Log.d("TESTING: SPEECH SERVICE", (String)data.get(i));
}
//if no "save it" somewhere in there, then continue:
if (mIsCountDownOn)
{
mIsCountDownOn = false;
}
mIsListening = false;
Log.d("TESTING: SPEECH SERVICE: CALL START", "onResults()");
startListening(true);
}
@Override
public void onRmsChanged(float rmsdB)
{
}
}
@Override
public IBinder onBind(Intent arg0) {
// TODO Auto-generated method stub
return null;
}
}
Ответы
Ответ 1
Я на Android 4.4 KitKat на Nexus 5, и у него есть эта же проблема. Я думаю, что это скорее ошибка Android, потому что я не видел никого с чистым решением.
Это решение похоже на решение Andrew_CS, но я думаю, что это на самом деле позволяет лучше распознавать. Решение Andrews постоянно запускает и останавливает распознавателя, и вы должны отслеживать состояние вещей, например, если вы обрабатываете речь или нет. Это новое решение /work -around в основном делает следующее:
- Как только onResults вызывается и наши результаты обрабатываются, мы запускаем таймер.
- Если все работает нормально, будет вызван onReadyForSpeech, и мы можем отменить наш таймер.
- Если что-то не работает должным образом, наш таймер заканчивается, и мы перезапускаем распознаватель речи и снова запускаем таймер.
- Убедитесь, что вы также отменили таймер в методе OnDestroy.
Пожалуйста, дайте мне знать, если вы найдете еще лучший способ, но сейчас это работает очень хорошо. Если мы действительно докажем, что это ошибка Android, я бы хотел, чтобы кто-то отправил ее в Google.
@Override
public void onReadyForSpeech(Bundle params) {
Log.d("Speech", "onReadyForSpeech: Cancel Timer");
if(mTimer != null) {
mTimer.cancel();
}
}
@Override
public void onResults(Bundle results) {
//If the timer is available, cancel it so it doesn't interrupt our result processing
if(mTimer != null){
mTimer.cancel();
}
Log.d("Speech", "onResults");
//Start processing data
ArrayList<String> strlist = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
for (int i = 0; i < strlist.size();i++ ) {
Log.d("Speech", "YOU SAID: " + strlist.get(i));
}
//Start listening again
Log.d("Speech", "onResults: Start Listening");
mSpeechRecognizer.startListening(mRecognizerIntent);
//Start a timer in case OnReadyForSpeech is never called back (Android Bug?)
Log.d("Speech", "onResults: Start a timer");
if(mTimer == null) {
mTimer = new CountDownTimer(2000, 500) {
@Override
public void onTick(long l) {
}
@Override
public void onFinish() {
Log.d("Speech", "Timer.onFinish: Timer Finished, Restart recognizer");
mSpeechRecognizer.cancel();
mSpeechRecognizer.startListening(mRecognizerIntent);
}
};
}
mTimer.start();
}
Ответ 2
Вы можете использовать:
intent.putExtra("android.speech.extra.DICTATION_MODE", true);
Этот код заставит службу прослушать длительное время.
Ответ 3
Попробуйте использовать один экземпляр SpeechRecognizer, нет необходимости его воссоздавать по методу stop(). Вызовите getSpeechRecognizer() в onCreate() и забудьте об этом. Но не забудьте уничтожить в методе onDestroy().
Ответ 4
Чтобы обойти эту проблему, я использовал CountDownTimer для постепенного вызова отмены и началаListening.
_timer = new CountDownTimer(300000000, 1000){
@Override
public void onTick(long millisUntilFinished){
if(!_processingSpeech){
_mSpeechRecognizer.cancel();
_mSpeechRecognizer.startListening(_mSpeechRecognizerIntent);
}
}
@Override
public void onFinish(){
setUpTimer();
}
};
_processingSpeech = false;
_timer.start();
Я использовал логическую обработкуSpeech в методах RecognitionListener, чтобы убедиться, что я не отменял и не перезапускал, пока я получал/обрабатывал ввод.
Сообщите мне, если это вам поможет, или вам нужна дополнительная информация. Удачи!