日記

まじめなブログにしたい・・・

Rawler 一覧ページから名前と画像を取得する。

ソース https://gist.github.com/4000687

 

一覧のページから飛んで、画像を欲しいという話があったので作成。一分くらいで完了する。

ポイント

複数のファイルの読み込み

[Iterator]をつかい、複数のURLを指定。[Texts]のところで[TextValue]を指定する。数が少なければ、カンマ区切りにして[Document]に入れて、それを[Split]してもいいと思う。

多段ページ読み込み

Rawlerの得意技、Page→(範囲指定)→Links→Page での多段ページ読み込み。

画像の取得とファイル名設定。

画像取得は、ImageLinks→DawonLoadの流れ。今回はファイルの名前を変えたいので、[SaveNameTree]から作成。とはいえ、直前のテキストは画像のURLなので、ページ全体を対象にするために、GetPageHtmlで最も近い[Page]からHTMLを取得して、それから処理をしている。

あと、作っている時にぼけていたのだけど、[NextDataRow]を入れておかないと、期待通りの振る舞いをしてくれないので、忘れずに入れる。