webdevqa.jp.net

AdobeAcrobatまたはAcrobatDistillerを使用してPDFを解凍することは可能ですか?

Web上で見つかったほとんどのPDFファイルには圧縮された読み取り不可能なデータストリームがあります。AcrobatまたはAcrobatDistillerを使用してPDFファイルの内部コンテンツを解凍することは可能ですか?テキストエディタでソースコードを読み取ることができますか?

P.S.この質問は、GhostScriptでどのように実行できるかを説明する this 回答に触発されています。

15
Alexey Popkov

これは qpdfpdftk で簡単です。

Adobe Acrobatを使用すると、a PDF(プロファイルを使用してプリフライト(例:PDF構文エラーを検出)、次にオプション->内部)をプロファイリングした後、内部構造を取得できます。 PDF構造)-しかし、編集可能なものを取得する方法はありませんテキストエディタを使用

6

使用 cpdf

cpdf -decompress in.pdf -o out.pdf

次に、各ページのグラフィック演算子をテキストエディタで読み取ることができます。ただし、参照として標準のコピーが必要になります。

開示:私はcpdfの作者です。

16
johnwhitington

qpdfおよびpdftkはすでに言及されています。コマンドを表示するには:

$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress

mutoolただし、まだ言及されていません:

$ mutool clean -d -a orig.pdf uncompressed-orig.pdf

mutoolは、軽量のMuPDF PDF +ドキュメントビューアと一緒に出荷されるコマンドラインツールです。

PDFオブジェクトのストリームをAcrobatまたはDistillerで解凍することはできないと思います(追加の有料ソフトウェアプラグインが利用可能でない限り)。

16
Kurt Pfeifle