API окна 7 OCR
Я просматривал замены для ODI Office 2007 MODI (решение OneNote 2010 имеет меньшее качество/результаты, чем 2007:-(). Я замечаю, что Windows 7 содержит библиотеку OCR после установки дополнительный фильтр tiff
Компонент OCR устанавливается на
%programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll
но я не вижу для него API?
Кто-нибудь видит, как это может быть сопряжено предпочтительно с С#?
ANSWER: нашел уступку, как только добавлена опция tiff ifilter win7, я могу получить текстовую версию скриншота с использованием кода /exe на http://www.codeproject.com/KB/cs/IFilter.aspx. Также, если добавить тот же [HKEY_CLASSES_ROOT.tiff\PersistentHandler] для .png и .jpg, тогда OCR также работает для jpg и png.
Ответы
Ответ 1
- Tessnet OCR - хорошее решение, но довольно старое (последний выпуск от 2009 года). Есть пара очень хороших бесплатных решений OCR для .NET:
- Asprise С# OCR SDK. Очень хороший и быстрый.
- Исследовательский проект Microsoft на Гавайях
Решение для распознавания текста на основе Интернета (облако) с полными документами и образцами (прекращено до 2013 года)
- Bing OCR
Замена OCR на основе веб-интерфейса (облако). (прекращено в марте 2014 г.)
Ответ 2
Попробуйте TessNet, используя предложения, которые я сделал для плаката в этом посте (увеличьте изображение, используйте отдельный процесс):
С# OCR не может распознавать цифры (tesseract 2)
Ответ 3
Я изучал DLL windows 7, и я нашел 3 библиотеки, которые могут быть полезны: thocr.psp.dll, xocr3.psp.dll и ximage3b.dll. В этом веб-сайте и других подобных сайтах я узнал, что ximage3b - это ОС Windows. Я искал документацию в Интернете, но я не был успешным, но эй! по крайней мере, я знаю, что это там, я дам вам ребята обновление, если я узнаю, как использовать его с С#/C/С++.