2007-06-12
宇多田ヒカルの日記用EFTを改造
plagger |
![]()
Plaggerで全文取得 (1)・宇多田ヒカルの日記を攻略する | Glassleaf (2007年06月09日)のEFTに手を入れてみた。
assets/plugins/Filter-EntryFullText/u3music_com_message.yaml
# Message from Utada Hikaru / Utada # http://www.u3music.com/message/ author: Kazuya@glassleaf custom_feed_handle: http://www\.u3music\.com/message/ custom_feed_follow_link: index\.php\?m=1&d=\d+j\.xml handle: http://www.u3music.com/message/index\.php\?\d+j\.xml #extract: <div class="blue">(.*?)</div>.*?(.*?) #extract_capture: title body extract_xpath: title: //div[@class="blue"]/text() date: //div[@class="blue02"]/text() body: //div[@class="txt"]/.. #extract_date_format: %m.%d\(%a\) %H:%M
extract_date_formatをコメントアウトしているのは理由が有って。DateTimeは年が無いとエラーを出して認識できないから。
monthとdayがあるけどyearが無い場合のPlagger::Date処理についていろいろと話したけど。
- 今年の値をデフォルトにする。(年またぎ時に誤動作するので「現時点から過去である」という条件を満たすように適度にデクリメントする)
- %a,%Aの曜日があれば、それと一致する年の値を割り出す
- extract_date_formatが設定されて無ければPlagger::Date->parse_dwimでDate::Parseする。(ただし1900年ベース)
のはどうかという感じ。
Plagger::Dateのparse_dwimで
コメント
トラックバック - http://subtech.g.hatena.ne.jp/otsune/20070612
