Ответ 1
Я один из создателей Word Lens. Несмотря на то, что там есть некоторые библиотеки OCR (например, tesseract), мы решили сделать наши собственные, чтобы добиться лучших результатов и производительности. Наш общий алгоритм выглядит следующим образом:
- скопировать изображение с камеры и получить его оттенок серого
- выровняйте изображение, чтобы текст четко выделялся на фоне.
- рисовать поля вокруг вещей, которые выглядят как символы и предложения
- do OCR: сопоставить пиксели в каждом поле с базой данных символов - это на самом деле довольно сложно!
- собирайте символы в слова, смотрите в словаре (это тоже сложно, потому что в OCR будут ошибки)
- верните результаты на изображение
Согласование изображений само по себе недостаточно, из-за огромного разнообразия шрифтов, слов и языков.
OpenCV - отличная библиотека, с которой можно работать и работать, а также узнать больше о компьютерном видении в целом. Я бы рекомендовал строить свои примеры и играть там. Получайте удовольствие!