perlで記述された WWWオートパイロットソフト
これはなに?
WWWcp とはいわゆる WWW オートパイロットソフトです.
かんたんにいうと,
「ほーむぺーじからぜんぶ持って来いよオラ」 (C)lune
っていうフリーソフトウェアです.
「だぶりゅだぶりゅだぶりゅしーぴー」と読みますが, 作者は「うーこぴ」などとよんでるのは内緒です
こんな人へ
接続したままねっとさーふしまくって課金地獄にな った
ひとつひとつ(クリックして)選択するのは面倒だ
人のホームページのバックアップしたい
ホームページコレクターだ
URL をいくつかいっぺんに取得したい
動作環境
perl バージョン 4.036 以上の環境で動くように作成されています.
現在動作確認されているのは FreeBSD, NetBSD, MkLinux, SunOS 等の perl 4.036, perl 5.00x です.
WINDOWS95/NT用のperl5 (日本語版) での動作確認も行いました.
BOW (BSD on WINDOWS)での確認はしてませんが問題ないようなきがします.
Macintosh の perl, OS/2 の perl での動作確認はいまだしていません(動いた, 動かないという連絡を 歓迎します).
特徴
起点以下のページ(等)をごっそり取得できる
起点以下でないページ(等)も取得できる
ファイルに書かれているページ(等)を取得したりできる
2 度目以降に取得するときは新しくなってるもののみ取得する
ローカルのディスクにしまうときファイルをかいざんしたりしない
クオートしてないタグも認識しちゃう
HTML 文書のみを取得できる
認証(パスワード)が必要なページ(等)も取得できる
PROXY 対応になっている
同時にいくつかの WWWcp を並列に走らせて取得したりできる
Mozilla とだまして取得できる
HTTP を内部で喋る
HTTP 以外のプロトコルのものも取得できるようになっている
取得した URL のログを取れる
perl 4, 5 で動くのでほとんどの OS で動く
動作が(割と)高速
本体(WWWcp)と perl さえあれば問題なく動かせる
メッセージ等がほとんど日本語である
プログラムにコメントがやたらおおい.
任意のパターンを含むファイルを取得しない
初期設定ファイル $HOME/.WWWcprc を読み込む
-1 で指定の URL だけを取得
? 付きの URL を取得できるようにした