PDFtkやpoppler-utilsに含まれるツールを使ってPDFを編集するコマンドのまとめです.
0. インストール
sudo apt install pdftk
sudo apt install poppler-utils
UbuntuあるいはBash on Windowsならaptコマンドで一発.
1. PDFの文書情報の表示
pdfinfo (ファイル名)
2. PDFの分割と結合
pdftk (入力ファイル) cat (ページの指定) output (出力ファイル)
ページ数の指定は1-12 14-endみたいな形で書けばよい. 入力ファイルを複数指定してページ数の指定を省略すればPDFの結合ができる.
3. PDFをJPEG/PNGに変換
pdftoppm [オプション] (入力ファイル名) (出力ファイル名の接頭辞)
JPEGが欲しい場合-jpegを, PNGが欲しい場合-pngをオプションに指定する. デフォルトの解像度はDPI150で粗すぎるのでオプションで-r 300ないし-r 600を指定すべき. 白黒画像にしたい場合は-monoないし-grayを指定 (個人的には-grayのが好み). 複数ページのPDFを変換すると, 出力ファイルは
(出力ファイル名の接頭辞)-1.jpg
(出力ファイル名の接頭辞)-2.jpg
みたいな形で生成される.
4. PDFからテキストを抽出
pdftotext (入力ファイル名) (出力ファイル名)
出力ファイルの文字コードはUTF-8, 改行コードはLF. 出力ファイル名は省略可能.
5. PDFから画像を抽出
pdfimages [オプション] (入力ファイル名) (出力ファイル名の接頭辞)
オプションについて: -pngでPNG, -jでJPEG, -tiffでTIFF形式で出力される (オプションなしだとPPM形式)
6. PDFを回転
pdftk (入力ファイル名) cat 1-end(向き) output (出力ファイル名)
向きとしてはleft, right, downまたはnorth, east, west, southが使用可能. ※向きを指定する前にスペースを入れるとエラーになる.
コメント
コメントを投稿