otsune's SnakeOil RSSフィード

python -c "print''.join([chr(x) for x in 111&1101,110+~-~11,10^11*11,110+~-~11,-~101,-~11^11*11,~-110,111&11*11,11+11+10,11|~-0110,1-~11^11*11,10^11*11,-~11^11*11,110,101])"

2007-10-26

それplagger前提だったらfollow_linkかfollow_xpathで出来るよ

| それplagger前提だったらfollow_linkかfollow_xpathで出来るよ - otsune's SnakeOil  を含むブックマーク はてなブックマーク - それplagger前提だったらfollow_linkかfollow_xpathで出来るよ - otsune's SnakeOil  それplagger前提だったらfollow_linkかfollow_xpathで出来るよ - otsune's SnakeOil  のブックマークコメント

本を読む IPA最新情報をPlaggerでフィード化を見て。

まぁWeb::ScraperPlagger::Date::parse相当のことをする実験だとは思うんだけど。

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www.ipa.go.jp/about/news/index.html
          meta:
            follow_link: (?:[\w]+/)+[-_\w]+\.html

  - module: CustomFeed::Simple

  - module: Filter::Rule
    rule:
      - module: RecentN
        count:  20

  - module: Filter::EntryFullText

  - module: Publish::Feed
#    disable: 1
    config:
      format: RSS
      dir: /usr/local/www/data/feed
      filename: ipa.rss

  - module: Publish::Feed
#    disable: 1
    config:
      format: Atom
      dir: /usr/local/www/data/feed
      filename: ipa.atom

もしくは

  - module: Subscription::Config
    config:
      feed:
        - url: http://www.ipa.go.jp/about/news/index.html
          meta:
            follow_xpath: //td[@valign="top"]/p/font/a

でいいかも。(www.ipa.go.jp/index.htmlだけXPathかRuleで除外する必要があるけど)

トラックバック - http://subtech.g.hatena.ne.jp/otsune/20071026