2006-10-08
XPathでorを使えば、揺らいでいるWebページの切り抜きも簡単にok
XPathを使ってPlagger::Plugin::Filter::EntryFullTextのHandlerを書く - mteramotoの日記から
author: mteramoto handle: http://blogs\.itmedia\.co\.jp/.+?/\d{4}/\d{2}/.+?\.html extract_xpath: body: //div[@class="contents" or @class="content_3"]
- handleの「/.+/」はgreedyじゃない「/.+?/」のほうが意図しない動作が減りそうな気がする(/[^/]+/と同等な動作の方が分かりやすい)
- contentsとcontent_3の両方が有ったりする腐ったblogページだったりするとどうなるんだろこれ
- 「Handler」と言わずに「○○のEFT」とか表現していたけど、no titleを見るとmiyagawaさんは「upgrader」とか書いているな
(Powered by id:youpy at #plagger-ja)
コメント
トラックバック - http://subtech.g.hatena.ne.jp/otsune/20061008
