Можно ли распаковать PDF с помощью Adobe Acrobat или Acrobat Distiller?
Большинство файлов PDF, найденных в Интернете, имеют сжатые и нечитаемые потоки данных. Можно ли разжать внутреннее содержимое файла PDF с помощью Acrobat или Acrobat Distiller, что позволяет нам читать исходный код с помощью текстового редактора?
P.S. Этот вопрос вдохновлен этим ответом, в котором объясняется, как это можно сделать с GhostScript.
Ответы
Ответ 1
Это легко с qpdf и pdftk.
С Adobe Acrobat вы можете получить внутреннюю структуру после профилирования PDF (предваритесь с некоторым профилем (например, обнаружите ошибки синтаксиса PDF), затем Options- > Internal PDF structure) - но нет способа получить что-то редактируемое с текстом редактор.
Ответ 2
Используйте cpdf:
cpdf -decompress in.pdf -o out.pdf
а затем графические операторы для каждой страницы могут быть прочитаны в текстовом редакторе. Однако вам понадобится копия стандарта в качестве ссылки.
Раскрытие информации: Я являюсь автором cpdf.
Ответ 3
qpdf
и pdftk
уже упомянуты. Чтобы показать команды:
$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress
mutool, однако еще не упоминался:
$ mutool clean -d -a orig.pdf uncompressed-orig.pdf
mutool
- инструмент командной строки, который поставляется вместе с облегченным средством просмотра документов PDF + PDF.
Я не думаю, что вы можете добиться разжатия потоков объектов PDF с помощью Acrobat или Distiller (если у вас нет дополнительных плагинов плагинов).