tokuhirom's Blog

html2text ってどうかくのが楽なんだっけ?

なんか適当にこうしてみたけど、div タグで改行とかしてくれなくて悲しい。もっとうまい方法があった気がするが、おもいだせない。

sub html2text {
    my ($html) = @_;

    require HTML::TreeBuilder;
    require HTML::FormatText;

    my $tree = HTML::TreeBuilder->new_from_content($html);
    my $formatter = HTML::FormatText->new( leftmargin => 0, rightmargin => 50 );
    my $text =  $formatter->format($tree);
    $tree = $tree->delete;
    return $text;
}

ref. http://subtech.g.hatena.ne.jp/mala/20091101/1257046426