Ответ 1
Вы должны установить "режим сегментации страницы" на "одиночный char".
Например, в Android вы делаете следующее:
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
Как представить:
Почему?
Вы должны установить "режим сегментации страницы" на "одиночный char".
Например, в Android вы делаете следующее:
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
Вам нужно настроить режим сегментации страницы Tesseract на "одиночный символ".
Вы видели это?
https://code.google.com/p/tesseract-ocr/issues/detail?id=581
Список ошибок показывает это как "больше не проблема".
baseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");
перед init Tesseract