日記

まじめなブログにしたい・・・

Ralwer ミクシーにアクセスする。

https://gist.github.com/4023418

ミクシーにアクセスして情報を取ってくるサンプル。入力ファイルは、ミクシーのコミュニティのURL一覧。この一覧と対応させた形で、画像のURLを取ってくる。

ポイント

作業フォルダの指定

ファイルの指定を簡単にするために[SetWorkFolder]で作業フォルダの指定をする。この場合、マイドキュメントに「ORF2012」というフォルダを指定している。存在しないときは新たに作る。これ以降、ファイル名を指定した時、そこにファイルが出来る。今までは、EXEが存在したところにファイルが溢れかえることになったが、そういうことがなくなった。

ミクシーにログインする

[LoginClient]を使いミクシーにログインする。この情報はログインページのHTMLを読んでやる。[LoginClient.LoginPostVals]でフォームに書いてあるパラメータを入れる。ミクシーの場合これでいい。

Rawler起動時にフォーム入力

@@をつなげると、ここは起動時にフォームが立ち上がり、そこで入力できるようにしてある。そのため、パスワードを直書きしなくてすむ。ここでは、@@name と@@passwdで名前とパスワードを起動時に入力できるようになっている。

URLのパラメータを取得する

[GetUrlParameter]はURLの中にあるパラメータの値を取得する。要は、動的なページによくある、?以降の文字の羅列から必要な情報を取得する。この場合は、「id」のパラメータを取得している。

ほかは、範囲を指定してそこの画像を取得する、それのデータを書き込むといったRawlerの得意作業。