Perlで漢字をひらがなに変換してみた

Text::MeCabモジュールを使って漢字をひらがなに変換してみました.

#!/usr/bin/env perl
use strict;
use warnings;
use Encode;
use utf8;
use Text::MeCab;

my $str = 'お腹が空いたので帰ります';

my $mecab = Text::MeCab->new;

my $yomi;
for ( my $node = $mecab->parse($str); $node->surface; $node = $node->next ) {
    my @features = split /,/, $node->feature;
    $yomi .= $features[7];
}
$yomi = decode_utf8 $yomi;
# カタカナからひらがなへ ※喘いでるわけではないです!
$yomi =~ tr/ァ-ン/-/;
print encode_utf8 $yomi,"\n";

出力結果

おなかがあいたのでかえります

バッチリですね.
えっ,何か変ですか?

おまけ ~ Ubuntuな人のためのインストール方法 ~

$ sudo aptitude install mecab-ipadic-utf8 mecab libmecab-dev
$ sudo cpan Text::MeCab

※Devel::CheckLibモジュールもインストールする必要があるかも

参考

たけまる / Perl - Text::MeCab を使ってみた
Perlでカタカナひらがな変換

広告
Favmemo の機能を追加して MASHUP AWARDS 6 に応募してみた Favmemoのタグ付けが手軽になりました&Evernoteの出力形式がキレイになりました
※このエントリーははてなダイアリーから移行したものです。過去のコメントなどはそちらを参照してください