Bulknews::Subtech RSSフィード

2006/09/11 (月)

[Perl] Read BOMed files 15:00  [Perl] Read BOMed files - Bulknews::Subtech を含むブックマーク はてなブックマーク -  [Perl] Read BOMed files - Bulknews::Subtech

BOM のついたUTF-8/16/32あたりのファイルを読んで Unicode 文字列にする。

use Encode;
use File::BOM;

open my $fh, '<:via(File::BOM)', $file or die "$file: $!";
my $buf = join '', <$fh>;
my $str = decode_utf8($buf);

$buf は utf-8 bytes であって UTF-8 flagged 文字列ではないことに注意。