otsune's SnakeOil RSSフィード

python -c "print''.join([chr(x) for x in 111&1101,110+~-~11,10^11*11,110+~-~11,-~101,-~11^11*11,~-110,111&11*11,11+11+10,11|~-0110,1-~11^11*11,10^11*11,-~11^11*11,110,101])"

2006-10-08

XPathでorを使えば、揺らいでいるWebページの切り抜きも簡単にok

XPathでorを使えば、揺らいでいるWebページの切り抜きも簡単にok - otsune's SnakeOil  を含むブックマーク はてなブックマーク - XPathでorを使えば、揺らいでいるWebページの切り抜きも簡単にok - otsune's SnakeOil  XPathでorを使えば、揺らいでいるWebページの切り抜きも簡単にok - otsune's SnakeOil  のブックマークコメント

XPathを使ってPlagger::Plugin::Filter::EntryFullTextのHandlerを書く - mteramotoの日記から

author: mteramoto
handle: http://blogs\.itmedia\.co\.jp/.+?/\d{4}/\d{2}/.+?\.html
extract_xpath:
  body: //div[@class="contents" or @class="content_3"]
  • handleの「/.+/」はgreedyじゃない「/.+?/」のほうが意図しない動作が減りそうな気がする(/[^/]+/と同等な動作の方が分かりやすい)
  • contentsとcontent_3の両方が有ったりする腐ったblogページだったりするとどうなるんだろこれ
  • 「Handler」と言わずに「○○EFT」とか表現していたけど、no titleを見るとmiyagawaさんは「upgrader」とか書いているな

(Powered by id:youpy at #plagger-ja)

トラックバック - http://subtech.g.hatena.ne.jp/otsune/20061008