Как использовать Opencv для распознавания документов с помощью OCR?

Я начинаю понимать компьютерное зрение, но я знаю, как использовать некоторые функции на opencv. Я пытаюсь использовать Opencv для распознавания документов, я хочу помочь найти шаги для него.

Я думаю использовать opencv example find_obj.cpp, но документы, например паспорт, имеют некоторые переменные, имя, дату рождения, фотографии. Итак, мне нужна помощь, чтобы определить шаги для него, и если возможно, как я должен использовать функцию на шагах.

Я не прошу целый код, но если у кого-нибудь есть ссылка на какой-либо пример или вы можете просто ввести прохождение, это очень помогает.

Ответы

Ответ 1

Здесь есть два очень разных шага. Один из них обнаруживает ваш объект, а другой анализирует его.

Для обнаружения объекта вы просто пытаетесь выяснить, находится ли объект в кадре и примерно где он находится. Возможности OpenCv отлично подходят для этого. Для некоторых обучающих программ и всеобъемлющего примера кода см. Учебники по OpenCv features2d и особенно соответствующие учебнику.

Для анализа вам нужно копаться в оптическом распознавании символов (OCR). OpenCv не включает библиотеки OCR, но я рекомендую проверить tesseract-ocr, что является отличной библиотекой OCR. Если ваши документы имеют фиксированную структурированную (согласованную компоновку текстовых полей), то tesseract-ocr - это все, что вам нужно. Для более продвинутого анализа, проверяющего ocropus, который использует tesseract-ocr, но добавляет анализ макета.