Реализация Java OCR
Это в первую очередь просто любопытство, но существуют ли какие-либо реализации OCR в чистой Java? Мне любопытно, как это будет выполняться исключительно на Java, и OCR в целом меня интересует, поэтому я хотел бы увидеть, как это реализовано на языке, который я полностью понимаю. Естественно, для этого потребуется, чтобы реализация была с открытым исходным кодом, но меня все еще интересуют проприетарные решения, поскольку я мог бы хотя бы проверить производительность в этом случае.
Я видел пару, которая может использоваться на Java (например, Asprise), но, похоже, это не чисто Реализации Java... есть ли какие-либо?
Ответы
Ответ 1
Я рекомендую попробовать проект Java OCR на sourceforge.net. Я изначально разработал его, и у меня запись в блоге.
Поскольку я положил его на sourceforge, его функциональность была расширена и улучшилась совсем немного благодаря большой работе волонтерского исследователя/разработчика.
Попробуйте, и если вам это не нравится, вы всегда можете его улучшить!
Ответ 2
Мы протестировали несколько движков OCR с Java, такими как Tesseract, Asprise, Abbyy и т.д. В нашем анализе Abbyy дал наилучшие результаты.
Ответ 3
Если вы ищете очень расширяемый вариант или имеете конкретный проблемный домен, вы можете подумать о том, чтобы свернуть его, используя Java Object Oriented Neural Engine. Еще одна ссылка JOONE.
Я успешно использовал его в личном проекте для идентификации буквы с изображения, такого как this, вы можете найти все источники для OCR-компонент моего приложения на github, здесь.
Ответ 4
Там есть множество библиотек OCR. Тем не менее, мой опыт заключается в том, что основные коммерческие реализации, ABBYY, Omnipage и ReadIris, намного превосходят реализацию с открытым исходным кодом или другие второстепенные реализации. Эти коммерческие библиотеки не предназначены в первую очередь для работы с Java, хотя, конечно, это возможно.
Конечно, если вы заинтересованы в изучении кода, реализация с открытым исходным кодом будет делать трюк.
Ответ 5
Просто нашел этот (не знаю, не тестировался, проверьте себя)
Ron Cemer Java OCR
Поскольку вам это нужно только для любопытства, вы можете заглянуть в источник этого апплета.
Это OCR рукописных символов с нейронной сетью
Java OCR: Распознавание рукописного ввода