otsune's SnakeOil RSSフィード

python -c "print''.join([chr(x) for x in 111&1101,110+~-~11,10^11*11,110+~-~11,-~101,-~11^11*11,~-110,111&11*11,11+11+10,11|~-0110,1-~11^11*11,10^11*11,-~11^11*11,110,101])"

2007-06-12

宇多田ヒカルの日記用EFTを改造

| 宇多田ヒカルの日記用EFTを改造 - otsune's SnakeOil  を含むブックマーク はてなブックマーク - 宇多田ヒカルの日記用EFTを改造 - otsune's SnakeOil  宇多田ヒカルの日記用EFTを改造 - otsune's SnakeOil  のブックマークコメント

Plaggerで全文取得 (1)・宇多田ヒカルの日記を攻略する | Glassleaf (2007年06月09日)EFTに手を入れてみた。

assets/plugins/Filter-EntryFullText/u3music_com_message.yaml

# Message from Utada Hikaru / Utada
# http://www.u3music.com/message/
author: Kazuya@glassleaf
custom_feed_handle: http://www\.u3music\.com/message/
custom_feed_follow_link: index\.php\?m=1&d=\d+j\.xml
handle: http://www.u3music.com/message/index\.php\?\d+j\.xml
#extract: <div class="blue">(.*?)</div>.*?(.*?)
#extract_capture: title body
extract_xpath:
  title: //div[@class="blue"]/text()
  date: //div[@class="blue02"]/text()
  body: //div[@class="txt"]/..
#extract_date_format: %m.%d\(%a\) %H:%M

extract_date_formatをコメントアウトしているのは理由が有って。DateTimeは年が無いとエラーを出して認識できないから。

monthとdayがあるけどyearが無い場合のPlagger::Date処理についていろいろと話したけど。

  • 今年の値をデフォルトにする。(年またぎ時に誤動作するので「現時点から過去である」という条件を満たすように適度にデクリメントする)
  • %a,%Aの曜日があれば、それと一致する年の値を割り出す
  • extract_date_formatが設定されて無ければPlagger::Date->parse_dwimでDate::Parseする。(ただし1900年ベース)

のはどうかという感じ。

Plagger::Dateのparse_dwimで

トラックバック - http://subtech.g.hatena.ne.jp/otsune/20070612