Mazn.net

やってみて 調べてみて 苦労しなけりゃ 箱は動かじ

コマンドラインからWebページを画像として保存@CygwinやLinux

      2011/10/08

スクリプトでWebページを保存するにはwgetを使えば簡単に実現できますが、これはあくまでもhtmlファイルや画像ファイルをそのまま保存するだけです。

Webページの表示そのものを画像として保存するには、ブラウザで表示して画面キャプチャすればよいのですが、これはスクリプトではできません。そういうときはwkhtmltopdf というツールが便利。Webページの表示をPDFや画像として保存できます。

PDFで保存するときは、 wkhtmltopdfコマンド を、画像で保存する場合はwkhtmltoimageコマンドを使用します。

使い方は簡単で画像の場合は、

# wkhtmltoimage.exe http://www.google.co.jp/ google.jpg

で画像化できます。オプション–crop-h  –crop-wを使えば一部を切り出すこともできます。

# wkhtmltoimage.exe --crop-h 500 --crop-w 700 http://www.google.co.jp/ google.jpg

上記の例では左上を基準に高さ300ピクセル、幅700ピクセルで保存されます。

google.jpg

切り出しの始点は、–crop-x や–crop-y で変更可能です。

# wkhtmltoimage.exe --crop-h 300 --crop-w 700 --crop-x 100 --crop-y 100 http://www.google.co.jp/ google.jpg

JavaScriptも処理できますので、Google Mapなども切り出し可能です。しかし画像のロードが遅延すると完全なマップがとりだせません。そういうこときは、–javascript-delay や –load-error-handling オプションを使ってあげます。また、–widthで前提とするブラウザの画面の横幅を変更することも可能です。

# wkhtmltoimage.exe --width 1280 --javascript-delay 10000 --load-error-handling ignore ・・・・以下省略

 - IT技術, プログラミング ,

336px

Message

メールアドレスが公開されることはありません。

  関連記事

no image
adblock plusで正規表現を使う@Firefox

広告削除ツールとして有名なFirefoxアドオンのaddblock plusで正 …

no image
リモートデスクトップでウィンドウ表示と全画面表示を切り替える@Windows 7

最近はクラウドやらなんやらで、Windows 付属のリモートデスクトップ機能を使 …

no image
Google Play Music で音楽が同期できない@Android 4.0

Google Play Music の Android アプリで、音楽が同期でき …

no image
Fedora 16 のLive CD (iso) を USBメモリから起動する @ grub2

まずはじめに、結論から言うと、Ubuntu の iso はUSBメモリから直接起 …

no image
DockerHubのイメージのタグ一覧をコマンドで取得する

docker コマンドでタグを指定せずにコンテナイメージをpullすると、lat …

no image
Firefox でファイルをダウンロードしようとすると、ダウンロードダイアログが開かない@Windows7 x64 + Firefox 3.5

Firefox でファイルをダウンロードしようとすると、なぜか保存ダイアログが開 …

no image
ネットワーク遅延のシミュレーション@CentOS 5

最近のLinux では、簡単にネットワーク遅延をシミュレーションできるようです。 …

no image
Firefox 3.6.x のメモリ消費が激しすぎる

Firefox を長時間使っていると、メモリ消費が700MBを超えています。 タ …

no image
XREA最悪

レンタルサーバとしてxreaを使ってましたが、日に日に動作が遅くなり、とうとう動 …

no image
CygwinでWindowsの拡張子に関連づけられたファイルを簡単に開く

Cygwin 使っていると、コマンドラインでいろいろと処理したくなりますよね? …