2006-04-21
COREBlog向けのEntryFullTextを書いた
Plagger |
![]()
assets/plugins/Filter-EntryFullText/coreblog.pl
sub handle_force {
my($self, $args) = @_;
$args->{content} =~ m!<div class="footer">\n.*Powered by COREBlog!
}
sub extract {
my($self, $args) = @_;
my $body = ($args->{content} =~ m!(<div class="category">.*?)<br clear="all" />!s)[0];
if ($body && ($args->{content} =~ m!<a name="more"></a>\n\s*(.*?)\n?</p>!s)[0]) {
$body .= $1;
}
$body;
}
実はリクナビblogはCOREBlogなので、blog_tech.rikunabi_next.yamlのhandleを変えるだけで対応できる気もするが。
assets/plugins/Filter-EntryFullText/pcweb_mycom.yamlでextract_date_format対応に
Plagger |
![]()
# upgrade http://pcweb.mycom.co.jp/haishin/rss/index.rdf
author: Nobuhito Sato
handle: http://pcweb\.mycom\.co\.jp/
extract: <!-- #BeginEditable "ContentsDate" -->(\d{4}/\d\d?/\d\d?)<!-- #EndEditable -->.*<!-- #BeginEditable "contents" -->(.*?)<!-- #EndEditable -->
extract_capture: date body
extract_date_format: %Y/%m/%d
でもwget -Sでpcweb.mycom.co.jpのヘッダーを見てみると、Date:が帰って来ている感じだから、これは要らない気配。
EntryFullTextでjournal.mycom.co.jpのAtomフィードを生成してみる
plagger |
![]()
ついでにrule:で種類別に切り出してみる。
global:
timezone: Asia/Tokyo
plugins:
- module: Subscription::Config
config:
feed:
- url: http://journal.mycom.co.jp/haishin/rss/index.rdf
- module: CustomFeed::Simple
- module: Filter::EntryFullText
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/series/\w+/\d+/|
config:
id: series
title: 【連載】 (MYCOM PC WEB)
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/articles/\d{4}/\d\d/\d\d/.*/|
config:
id: articles
title: 【レポート】 (MYCOM PC WEB)
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/objc/\d+/|
config:
id: objc
title: 【コラム】 ダイナミックObjective-C (MYCOM PC WEB)
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/winxp/\d+/|
config:
id: winxp
title: 【コラム】 Windows XPスマートチューニング (MYCOM PC WEB)
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/rikei/\d+/|
config:
id: rikei
title: 【コラム】理系のための恋愛論 (MYCOM PC WEB)
- module: SmartFeed
rule:
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/osx/\d+/|
config:
id: osx
title: 【コラム】 OS Xハッキング! (MYCOM PC WEB)
- module: SmartFeed
rule:
# expression: $args->{entry}->link =~ m|news|
expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/news/\d{4}/\d\d/\d\d/\d+\.html|
config:
id: news
title: ニュース (MYCOM PC WEB)
- module: Publish::Feed
config:
format: Atom
dir: /home/otsune/public_html/plagger/feed
filename: journal-mycom-%i.atom
IRCでmiyagawaさんから方法を教わったら出来た。すばらしい。
yamlの文字コードをUTF-8にしないとbloglinesに読み込んだときに文字化けした。
(追記:mycomからjournalにURLが変わったので変更した)
コメント
トラックバック - http://subtech.g.hatena.ne.jp/otsune/20060421
