Linuxゲリラ戦記

vimで画像収集シェルスクリプト(その2)を作るよ

アイキャッチ

62.Linux画像収集スクリプト再び

ナックス「ごめんなさい!!」

デビー君「うわっ!!どうしたの?」

ナックス「ほんとマジでごめんなさい……。まさかデビー君に人生最大の危機が起きていたとは……。今まで全然気づかなかった──!!」

デビー君「ぼ、僕の危機?」

ナックス「前に作り方教えた画像収集ソフトだけど、Googleの野郎が『APIバージョン変えたよ。新しいバージョンにしたよ』とか、私の許可無くやりやがって、解説で教えたAPIがdeprecated(非推奨)になってやがる!!リンク切れまで起こしてやがる!!これじゃあデビー君が安心してエロ画像を収集できないじゃないか!!」

デビー君「それ?それ僕の人生最大の危機なの?僕の人生ってそんな安い人生なの?」

ナックス「だってデビー君、前に『ノー エロ画像、 ノー ライフ』って」

デビー君「言ってないよ?そんなにおしゃれに最低なこと言ってないよ?」

ナックス「API便利なんですが、やっぱりバージョンとか変わると面倒くさいですね。おかげで、多分いま最初からLinuxゲリラ戦記で勉強してる人は、多分あの画像収集アプリ作成の所で躓いてますよ。いや、今のところ非推奨って言うことは、一応ギリギリ使えてると思うんですけど、そのうち使えなくなりますからね」

ナックス「というわけで、今回は画像収集スクリプト(その2)を作成しましょう。今回はAPI使わないで、どっかの画像検索サイトのコードを生でガリガリ解析して作りましょう」

ナックス「そうすれば、もしそのサイトがなくなっても、他の画像検索サイトで同じ方法で画像収集ソフトの作成が出来る事になりますからね」

ナックス「APIを使用した方法だと、そのAPIの提供をしているサイトでしか使えないですしね」

ナックス「というわけで、次回はまず、Linuxコマンドによる検索ロボットの作り方を解説しようと思う」

デビー君「検索ロボット?」

ナックス「そうです。検索ロボットです」

デビー君「検索ロボットって何?」

ナックス「例えば、Googleで検索窓に検索キーワードを入れると、いろんなサイトが検索できるでしょ?その仕組みは、事前にGoogleが『検索ロボット』っていうネットワークロボットを使って、インターネット上にあるあらゆるウェブサイトの情報を収集するんだ。で、収集した情報をGoogle社内で分析したり加工したりして、検索に便利な状態にしておいて、最後に私達は検索で、その情報を使ってサイトを検索してるんだ」

デビー君「へー……それが『検索ロボット』」

ナックス「そうです。検索ロボット」

デビー君「すごくね?」

ナックス「すげぃよ?」

デビー君「じゃあ、もし今回作成する画像収集スクリプトが完成したら、インターネット上のあらゆる画像を検索、収集できるようになるの?」

ナックス「いいえ。今後の解説を見ればわかると思うけど、検索して画像収集、っていうので重要なのは『検索ロボット』じゃなくて『収集した情報を分析、加工』の方なんです。なので、頑張れば『インターネット上にある全ての画像のダウンロード』は作れるけど、『インターネット上にある特定の画像だけダウンロード』は無理です」

デビー君「そうなの?なんか『インターネット上にある全ての画像のダウンロード』のほうが難しそうだけど」

ナックス「いや。正直、『何億とあるサイトから欲しい情報だけを検索する』って結構難しい技術だと思うよ。多分、ものすごく単純な情報分析で精度の低いものなら、めっちゃ頑張れば作れると思うけど、Googleみたいに検索精度の高い情報分析って一体どうやってるのか謎だよ。Googleすげぃよ」

ナックス「ちなみに、『インターネット上にある全てのウェブサイトのダウンロード(収集)』は簡単です」

デビー君「マジで?」

ナックス「マジだよ。多分、次回か、次々回くらいで教えられると思うよ」

ナックス「あ、でも、一応私の中でのメインは『皆にVimの使い方を知ってほしい』だからね。みんな今後の解説で出来ればnanoじゃなくてVimで作ってね」

ナックス「次回!!『63.wgetの真の力、見せてくれるわ!!』!!」

このエントリーをはてなブックマークに追加