otsune's SnakeOil RSSフィード

python -c "print''.join([chr(x) for x in 111&1101,110+~-~11,10^11*11,110+~-~11,-~101,-~11^11*11,~-110,111&11*11,11+11+10,11|~-0110,1-~11^11*11,10^11*11,-~11^11*11,110,101])"

2006-04-21

COREBlog向けのEntryFullTextを書いた

| COREBlog向けのEntryFullTextを書いた - otsune's SnakeOil  を含むブックマーク はてなブックマーク - COREBlog向けのEntryFullTextを書いた - otsune's SnakeOil  COREBlog向けのEntryFullTextを書いた - otsune's SnakeOil  のブックマークコメント

assets/plugins/Filter-EntryFullText/coreblog.pl

sub handle_force {
    my($self, $args) = @_;
    $args->{content} =~ m!<div class="footer">\n.*Powered by COREBlog!
}

sub extract {
    my($self, $args) = @_;
    my $body = ($args->{content} =~ m!(<div class="category">.*?)<br clear="all" />!s)[0];
    if ($body && ($args->{content} =~ m!<a name="more"></a>\n\s*(.*?)\n?</p>!s)[0]) {
        $body .= $1;
    }
    $body;
}

実はリクナビblogCOREBlogなので、blog_tech.rikunabi_next.yamlのhandleを変えるだけで対応できる気もするが。

assets/plugins/Filter-EntryFullText/pcweb_mycom.yamlでextract_date_format対応に

| assets/plugins/Filter-EntryFullText/pcweb_mycom.yamlでextract_date_format対応に - otsune's SnakeOil  を含むブックマーク はてなブックマーク - assets/plugins/Filter-EntryFullText/pcweb_mycom.yamlでextract_date_format対応に - otsune's SnakeOil  assets/plugins/Filter-EntryFullText/pcweb_mycom.yamlでextract_date_format対応に - otsune's SnakeOil  のブックマークコメント

# upgrade http://pcweb.mycom.co.jp/haishin/rss/index.rdf
author: Nobuhito Sato
handle: http://pcweb\.mycom\.co\.jp/
extract: <!-- #BeginEditable "ContentsDate" -->(\d{4}/\d\d?/\d\d?)<!-- #EndEditable -->.*<!-- #BeginEditable "contents" -->(.*?)<!-- #EndEditable -->
extract_capture: date body
extract_date_format: %Y/%m/%d

でもwget -Sでpcweb.mycom.co.jpのヘッダーを見てみると、Date:が帰って来ている感じだから、これは要らない気配。

EntryFullTextでjournal.mycom.co.jpのAtomフィードを生成してみる

| EntryFullTextでjournal.mycom.co.jpのAtomフィードを生成してみる - otsune's SnakeOil  を含むブックマーク はてなブックマーク - EntryFullTextでjournal.mycom.co.jpのAtomフィードを生成してみる - otsune's SnakeOil  EntryFullTextでjournal.mycom.co.jpのAtomフィードを生成してみる - otsune's SnakeOil  のブックマークコメント

ついでにrule:で種類別に切り出してみる。

global:
  timezone: Asia/Tokyo

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://journal.mycom.co.jp/haishin/rss/index.rdf
  - module: CustomFeed::Simple
  - module: Filter::EntryFullText

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/series/\w+/\d+/|
    config:
      id: series
      title: 【連載】 (MYCOM PC WEB)

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/articles/\d{4}/\d\d/\d\d/.*/|
    config:
      id: articles
      title: 【レポート】 (MYCOM PC WEB)

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/objc/\d+/|
    config:
      id: objc
      title: 【コラム】 ダイナミックObjective-C  (MYCOM PC WEB)

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/winxp/\d+/|
    config:
      id: winxp
      title: 【コラム】 Windows XPスマートチューニング (MYCOM PC WEB)

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/rikei/\d+/|
    config:
      id: rikei
      title: 【コラム】理系のための恋愛論 (MYCOM PC WEB)

  - module: SmartFeed
    rule:
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/column/osx/\d+/|
    config:
      id: osx
      title: 【コラム】 OS Xハッキング! (MYCOM PC WEB)

  - module: SmartFeed
    rule:
#     expression: $args->{entry}->link =~ m|news|
      expression: $args->{entry}->link =~ m|http://journal\.mycom\.co\.jp/news/\d{4}/\d\d/\d\d/\d+\.html|
    config:
      id: news
      title: ニュース (MYCOM PC WEB)

  - module: Publish::Feed
    config:
      format: Atom
      dir: /home/otsune/public_html/plagger/feed
      filename: journal-mycom-%i.atom

IRCmiyagawaさんから方法を教わったら出来た。すばらしい。

yaml文字コードUTF-8にしないとbloglinesに読み込んだときに文字化けした。

(追記:mycomからjournalにURLが変わったので変更した)

トラックバック - http://subtech.g.hatena.ne.jp/otsune/20060421