otsune's SnakeOil RSSフィード

python -c "print''.join([chr(x) for x in 111&1101,110+~-~11,10^11*11,110+~-~11,-~101,-~11^11*11,~-110,111&11*11,11+11+10,11|~-0110,1-~11^11*11,10^11*11,-~11^11*11,110,101])"

2006-06-28

del.icio.usからはてなブックマークにシンクロするyaml

 del.icio.usからはてなブックマークにシンクロするyaml - otsune's SnakeOil  を含むブックマーク はてなブックマーク -  del.icio.usからはてなブックマークにシンクロするyaml - otsune's SnakeOil   del.icio.usからはてなブックマークにシンクロするyaml - otsune's SnakeOil  のブックマークコメント

PukkaというMac OS X向けdel.icio.usブックマーク専用ツールがあったので、それをテストすることにした。

なんかはてなブックマークpostが最近重いので。(MM/memoも同じ理由でポストを控えたんだよな。Publish::MMmemoが出来れば同期するのはやぶさかではないのだが……)

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://del.icio.us/rss/USERNAME

  - module: Aggregator::Simple
  - module: Filter::DeliciousFeedTags
#  - module: Filter::Reverse
#  - module: Filter::AntiAmazonAssociate                                       
  - module: Filter::Rule
    rule:
      module: Deduped

  - module: Publish::HatenaBookmark
    config:
      username: USERNAME
      password: PASSWORD
      interval: 5
      post_body: 1

Filter::AntiAmazonAssociateはPlagger::Plugin::Filter::AntiAmazonAssociate - fubaはてなから。

Filter::Reverseは [sbm] del.icio.us to hatebu - nirvashの日記から。

最初Googleで検索したけど、nirvashさんの日記がひっかからねーひっかからねー。

bloglines2gmailで購読したGMail全文検索だとサックリ見つかった。

追記:はてなブックマークAtomAPIとは はてなの人気・最新記事を集めました - はてなによると

PostURI による投稿時はブックマークのタイトルを編集することはできません。

ということなので、現状のPublish::HatenaBookmarkだとタイトルがシンクロしないな。

1ページのhtmlファイルから正規表現で切り出して複数のフィードにする仕組みが欲しいな

1ページのhtmlファイルから正規表現で切り出して複数のフィードにする仕組みが欲しいな - otsune's SnakeOil  を含むブックマーク はてなブックマーク - 1ページのhtmlファイルから正規表現で切り出して複数のフィードにする仕組みが欲しいな - otsune's SnakeOil  1ページのhtmlファイルから正規表現で切り出して複数のフィードにする仕組みが欲しいな - otsune's SnakeOil  のブックマークコメント

CustomFeed::SoftAntenna作ってみました - Seacolor Labs. - Plaggerグループを見て。

ポイントは

    while ($content =~ m!<li class=saitem><strong><a href="(https?://[^"]*)">(.*?)</a>[^\n]+\n<span class=small>(.*?)</span>\n!g) {
        my($link, $title, $body) = ($1, $2, $3);

        my $entry = Plagger::Entry->new;
        $entry->title(decode('iso 2022-jp', $title));
        $entry->link($link);
        $entry->body(decode('iso 2022-jp', $body));

        $feed->add_entry($entry);
    }

の部分だから、

custom_feed_handle: ^http://www\.softantenna\.com/index.html$
custom_feed_extract: <li class=saitem><strong><a href="(https?://[^"]*)">(.*?)</a>[^\n]+\n<span class=small>(.*?)</span>\n
custom_feed_extract_capture: title link body

みたいなEntryFullTextで指定できると良いかも。

最少マッチにしないと項目ごとのfeedに成らないので注意して正規表現を書かないといけないけど。

追記:miyagawaさんのコメントではてなブログがそれじゃないかと。

SeacolorSeacolor2006/06/28 20:52実は最初EntryFullTextでやろうとして、できない事に気付いてCustomFeedにしたという経緯があったりします。

miyagawamiyagawa2006/06/30 03:26woremacxさんのCustomFeed::Config でできるのかな

トラックバック - http://subtech.g.hatena.ne.jp/otsune/20060628