Ответ 1
Привет, я думаю, что вам не нужно писать программу для вашей цели. Я имею в виду чтение pdf файла в консольном режиме, потому что команда "less" уже делает это за вас. Так что используйте его и наслаждайтесь им.
less "имя файла pdf"
Эй, довольно давно, я ищу программу просмотра PDF для командной строки.
Как мне нравится работать без X на Linux и часто работать на удаленной машине, мне бы хотелось иметь инструмент для чтения pdf файлов. Есть довольно много действительно хороших графических программ (evince, okular, acroread,...), чтобы выполнить эту работу, поэтому я решил, что должен быть хотя бы один достойный инструмент текстового режима. Но я даже не знаю, как дерьмовый!
В настоящее время я либо запускаю X только для чтения pdf файлов, либо для использования pdftohtml + lynx. Однако последнее не дает очень хорошего результата, и большинство документов просто не читаются, особенно если они содержат математическую формулу.
Google полна людей, которые говорят, что это невозможно или предлагается версия pdftohtml.
Я понимаю, это не совсем вопрос программирования, но сейчас я рассматриваю возможность запуска проекта для реализации такой программы, если там уже не будет хорошего.
Спасибо за любые предложения.
Привет, я думаю, что вам не нужно писать программу для вашей цели. Я имею в виду чтение pdf файла в консольном режиме, потому что команда "less" уже делает это за вас. Так что используйте его и наслаждайтесь им.
less "имя файла pdf"
Хорошо, вы попросили узнать даже "дрянные". Вот два (решайте сами о своей соответствующей чепухе):
Сначала: устройство вывода txtwrite
Ghostscript
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
Второе: утилита CLI > pdftotext
(лучше, чем Ghostscript):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
Это отобразит диапазон страниц 13 ( f первая страница) до 17 ( l ast страница), сохраните макет защищенного двойным паролем имени файла PDF ( используя секретные и суперсекретные пароли пользователей и владельцев), с соглашением Unix EOL, но без вставки разрывов страниц между страницами PDF, пропущенных через меньше...
pdftotext -h
отображает все доступные параметры командной строки.
Конечно, оба инструмента работают только для текстовых частей PDF файлов (если они есть). О, и математическая формула тоже не будет работать слишком хорошо...; -)
Изменить: Я неправильно набрал команду выше (изначально используя pdftops
вместо pdftotext
).
fbgs может сделать трюк.
Существует также green просмотрщик PDF. Существует демонстрация на YouTube.
Кстати, я всегда в одной и той же ситуации, и я использую mc (midnight commander), который отлично обрабатывает текст pdf... Просто просмотрите файл (F3) в mc
fbpdf - просмотрщик фреймбуфера PDF.
Существует также вилка jfbpdf, но на данный момент я не могу заставить ее работать.
Это будет работать, только если ваш PDF-документ структурирован, т.е. это с тегами PDF.
Это необходимо для получения правильного порядка чтения текстовых объектов в документе.
Отмеченные документы в формате PDF также позволяют повторно документировать документ, хотя я не знаю о каком-либо инструменте, который делает это с выходом командной строки.