Реальная обработка изображений TIme (OCR)

Я планирую разработать приложение, например Word Lens. Может ли кто-нибудь предложить хорошую библиотеку, которую я могу использовать? или кто-нибудь объясняет технологию, лежащую в основе приложения Word Lens? это совпадение времени изображения барабана или OCR? Я знаю некоторую библиотеку обработки изображений, такую как OpenCv, tesseract... Любая помощь очень ценится...

Ответ 1

Я один из создателей Word Lens. Несмотря на то, что там есть некоторые библиотеки OCR (например, tesseract), мы решили сделать наши собственные, чтобы добиться лучших результатов и производительности. Наш общий алгоритм выглядит следующим образом:

скопировать изображение с камеры и получить его оттенок серого
выровняйте изображение, чтобы текст четко выделялся на фоне.
рисовать поля вокруг вещей, которые выглядят как символы и предложения
do OCR: сопоставить пиксели в каждом поле с базой данных символов - это на самом деле довольно сложно!
собирайте символы в слова, смотрите в словаре (это тоже сложно, потому что в OCR будут ошибки)
верните результаты на изображение

Согласование изображений само по себе недостаточно, из-за огромного разнообразия шрифтов, слов и языков.

OpenCV - отличная библиотека, с которой можно работать и работать, а также узнать больше о компьютерном видении в целом. Я бы рекомендовал строить свои примеры и играть там. Получайте удовольствие!

Реальная обработка изображений TIme (OCR)

Ответы

Ответ 1