Реальная обработка изображений TIme (OCR)

Я планирую разработать приложение, например Word Lens. Может ли кто-нибудь предложить хорошую библиотеку, которую я могу использовать? или кто-нибудь объясняет технологию, лежащую в основе приложения Word Lens? это совпадение времени изображения барабана или OCR? Я знаю некоторую библиотеку обработки изображений, такую ​​как OpenCv, tesseract... Любая помощь очень ценится...

Ответы

Ответ 1

Я один из создателей Word Lens. Несмотря на то, что там есть некоторые библиотеки OCR (например, tesseract), мы решили сделать наши собственные, чтобы добиться лучших результатов и производительности. Наш общий алгоритм выглядит следующим образом:

  • скопировать изображение с камеры и получить его оттенок серого
  • выровняйте изображение, чтобы текст четко выделялся на фоне.
  • рисовать поля вокруг вещей, которые выглядят как символы и предложения
  • do OCR: сопоставить пиксели в каждом поле с базой данных символов - это на самом деле довольно сложно!
  • собирайте символы в слова, смотрите в словаре (это тоже сложно, потому что в OCR будут ошибки)
  • верните результаты на изображение

Согласование изображений само по себе недостаточно, из-за огромного разнообразия шрифтов, слов и языков.

OpenCV - отличная библиотека, с которой можно работать и работать, а также узнать больше о компьютерном видении в целом. Я бы рекомендовал строить свои примеры и играть там. Получайте удовольствие!