Linuxゲリラ戦記

「君の名前は今日から桃太郎だ!」「ダサいから嫌だ」

67.wgetでダウンロードするファイルのダウンロード後の名前を指定

ナックス「前回、へそブルーから『水着グラビア』の検索結果を取得した時、使用しているLinuxディストリビューションによってはファイル名が文字化けしたかもしれません」

デビー君「うんうん」

ナックス「というわけで、今回は前回のファイルをさくっと削除してファイル名を指定してダウンロードすることにしよう」

デビー君「へー。そんなことが出来るんだ」

ナックス「まず、前回のファイルを削除だ!」

$ rm heso.blue/in

ナックス「ココらへんまで書けば、あとはTabキーを押せばファイル名が補完されて」

$ rm heso.blue/index.html\?text\=%E6%B0%B4%E7%9D%80%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2\&page\=1 

ナックス「そして実行しなさい!!rmコマンドにより、無事にファイルが消えるから」

デビー君「消えました」

ナックス「じゃあ次は、ファイルをダウンロードしたいところのディレクトリに移動して」

$ cd heso.blue/

ナックス「インターネットブラウザ(インターネットをするソフト)で以下のサイトにアクセスして」

へそブルー http://www.heso.blue

ナックス「水着グラビアで検索した結果のアドレスバーにあるアドレス」

http://www.heso.blue/?text=%E6%B0%B4%E7%9D%80%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2&page=1

ナックス「をwgetコマンドを使用して指定するんだけど、今回はダウンロード後のファイル名を指定するぞ。-O(オーだよ。ゼロじゃないよ。)オプションだ!」

$ wget "http://www.heso.blue/?text=%E6%B0%B4%E7%9D%80%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2&page=1" -O gurabia.html

ナックス「実行したら、gurabia.htmlというファイル名でファイルが取得できるよ」

デビー君「ほう」

ナックス「できた?」

デビー君「できたよ」

$ ls
gurabia.html

ナックス「次回!!68.Vimによるファイル内検索!」

補足

へそブルー - 画像検索サイト」に関して

この画像検索サイトですが、bingのAPIを使用して作成しています(Bing Search API | Microsoft Azure Marketplace)。で、APIに制限がありまして、1ヶ月につき5000回しか検索できません。

たまに画像検索サイトで検索できなくなってる場合がありますが、私のせいじゃないよ。検索制限回数に達したからだよ。

最近、へそブルーで検索できないことが頻発しています。たぶん、自力で画像収集スクリプトを作成して、へそブルーを利用している人がいると思うのですが、可能であれば検索回数をできるだけ少なくして収集できるようにスクリプト修正していただけると助かります(画像の検索結果一ページにつき2回APIにリクエストを投げています。つまり、例えば wget "http://www.heso.blue/?text=%E6%B0%B4%E7%9D%80%E3%82%B0%E3%83%A9%E3%83%93%E3%82%A2&page=1" という風に1回wgetコマンドを使用すると2回APIを使用したことになります。)

また、これを見ている人で「画像検索サイトを通してじゃなくて、Bing APIを直に教えてくれればいいのに」と思っている方もいると思いますが、このAPIは無料で使えますが、使用にメルアドの登録が必要です。そして、私は初心者の方の心を読めるのですが、プログラミング初心者の人って「メルアド登録したらAPI無料で使えるからメルアド登録してね」って言っても絶対に面倒臭がってメルアド登録してくれないじゃないですか。そして私のサイトから去るんだ……。というわけで解説ではへそブルーを使用して画像収集プログラムを作成する予定です。ただ、もしチャレンジ精神があるならぜひBing Search API | Microsoft Azure Marketplaceを解読して直接APIを叩いて画像収集するプログラムを作成することに挑戦してみてください。

このエントリーをはてなブックマークに追加