Ответ 1
На основе вашего комментария все, что вам нужно, - это отсканировать относительно небольшой объем документов с почти 100% точностью, а ваш бюджет составляет около 200 $
Ну, тогда ответ прост. Вам не нужно какое-либо программное решение. Просто купите качественный коммерческий продукт OCR, т.е. ABBYY FineReader (отказ от ответственности: я работаю для ABBYY). У него разные цены в разных регионах, но я думаю, что это где-то около вашего бюджета.
Коммерческий продукт OCR для настольных компьютеров предоставит вам стандартную точность почти 100% на типичных языках. Кроме того, они имеют удобные средства проверки вручную, чтобы исправить все остальные ошибки. Как правило, они поддерживают целый ряд современных шрифтов, но если ваш шрифт не является тривиальным, для этого у них есть программа для обучения шрифтов.
Я думаю, что это оптимальное решение для вас.
UPDATE: платформа Linux. К сожалению, почти нет выбора высококачественных OCR-продуктов для Linux, извините. Единственное, что я знаю, это ABBYY: http://ocr4linux.com/en:start, но у него нет интерфейса, проверки и обучения шрифтов. Но, по крайней мере, вы можете попытаться понять, даст ли он вам достаточно хорошую точность, как это возможно, что может случиться.