フォト蔵に登録した画像を抜き出すscript

2011/10/23

photozou ruby web

t f B! P L
記事内に広告が含まれています。

RSSから、オリジナルの画像のURLを取ってくるスクリプト。どうやらRSSでは100件しか配信されないっぽいのだが、このスクリプトの出力をファイルにして、wget -i このスクリプトの出力ファイルとすると、100件までならダウンロードできる。

RSSのURLを直書きしているので、必要に応じて書き換えること。

#!/usr/bin/ruby
#
require 'rubygems'
require 'open-uri'
require 'rexml/document'
require 'net/http'
require 'base64'
require 'pp'

Net::HTTP.version_1_2
$KCODE = 'UTF8'

AGENT = 'dumpPhotozou.rb/ruby/#{RUBY_VERSION}'

def readPhotozou
  begin
    src = open("http://photozou.jp/feed/photo_list/72624/all.xml",
               "User-Agent" => AGENT) {|f|
      f.read
    }
  rescue
    return $false
  end
  
  doc = REXML::Document::new(src).root
  if doc.nil?
    return $false
  end
  doc.elements.to_a('//item').reverse.each {|item|
    if (item.nil? || item.elements['link'].nil? || item.elements['link'].text.nil?)
      next
    end
    if /.*\/(.*)$/ =~ item.elements['link'].text
      id = $1
      begin
        photo_src = open("http://api.photozou.jp/rest/photo_info?photo_id=#{id}") {|f|
          f.read
        }
      rescue
        return $false
      end
      
      photo = REXML::Document::new(photo_src).root
      if photo.nil?
        return $false
      end
      puts(photo.elements.to_a('//original_image_url')[0].text)
    end
  } # end of each
end # end of def

if !readPhotozou
  puts "error"
end

不要なコードが残っていたので消したけど、まだ残っているかな?

楽天で探す
楽天市場
にほんブログ村 IT技術ブログへ

人気の投稿

ブログ アーカイブ

自己紹介

パワハラをなぁなぁで済まそうとする奴がCxOやっている会社を辞めました。ストックオプションは半分しか行使できなかったけど、あんな人たちには関わりたくないですね。

アフィリエイト

  • 当ブログ「Hiroaki's blog」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、Amazonアソシエイト・プログラムの参加者です。
  • 当ブログでは、第三者配信による広告サービスを利用しています。このような広告配信事業者は、ユーザーの興味に応じた商品やサービスの広告を表示するため、当サイトや他サイトへのアクセスに関する情報 (氏名、住所、メール アドレス、電話番号は含まれません) を使用することがあります。このプロセスの詳細やこのような情報が広告配信事業者に使用されないようにする方法については、ここをクリックしてください。
  • アクセストレードアフィリエイトプログラムに参加しています。
  • A8.netアフィリエイトプログラムに参加しています。
  • バリューコマースアフィリエイトプログラムに参加しています。
  • もしもアフィリエイトプログラムに参加しています。

プライバシーポリシー

当サイトにアクセスされる場合、IPアドレスなどの情報または閲覧状況に関するデータが機械的に生成され、場合によっては個人情報と関連付けられる可能性があります。プライバシー保護に関する適用法に準じて、これらの通信および閲覧に関するデータを収集、処理、および利用することがあります。
当サイトにアクセスされる場合、非個人情報(ブラウザの種類、OSの種類、ドメイン名、訪問数、平均滞在時間、ページ・ビューなど個人を特定できない情報)が自動収集される場合があります。当サイトのパフォーマンスやコンテンツを改善する目的で、これらの情報を利用する場合があります。
アフィリエイトでは成果を把握するためにcookie等を利用しています。それ以外の目的で使用されることはありません。詳しくは各社のページにて確認してください。
本サイトに掲載する情報に関しては、正しいものを提供することを務めていますが、掲載内容から、いかなる損失や損害などの被害が発生しても、当ブログでは責任を追いかねます。

改正電気通信事業法に関する表記

・掲載内容

当サイトでは成果報酬型広告/クリック型広告の効果測定のため、利用者の方のアクセス情報を外部事業者に送信しております。
当該の情報は個人を特定する情報ではございません。また当該の情報が目的外利用される事は一切御座いません。

1.送信される情報の内容
  • 広告の表示日時
  • 広告のクリック日時
  • 広告の計測に必要なクッキー情報
  • 広告表示時及び広告クリック時のIPアドレス
  • 広告表示時及び広告クリック時に使用されたインターネット端末およびインターネットブラウザの種類
2.送信先となる事業者の氏名又は名称
  • グーグル合同会社
  • 楽天グループ株式会社
  • アマゾンジャパン合同会社
  • ヤフー株式会社
  • 株式会社ファンコミュニケーションズ
  • 株式会社もしも
3.利用目的

成果報酬型広告/クリック型広告の効果測定および不正防止のため

QooQ