漢字や平仮名をアルファベット文字列に変換するライブラリをさがしています。例えば


はてな -> hatena

のようなものです。単純にローマ字表記にするものでかまいません。

実装は PHP のものが一番いいですが、Perl や Ruby、Python 等でも OK です。

ご存知の方、教えてください。

回答の条件
  • 1人5回まで
  • 登録:2006/05/29 14:02:09
  • 終了:2006/05/29 14:21:28

回答(3件)

id:taknt No.1

きゃづみぃ回答回数13539ベストアンサー獲得回数11982006/05/29 14:06:07

ポイント27pt

http://taiyaki.org/suikyo/

こちらにRuby用があります。

ひらがな→ローマ字変換ですが。

id:typos24

どうもです。参考にします。

2006/05/29 14:17:39
id:masahikokimoto No.2

masahikokimoto回答回数241ベストアンサー獲得回数102006/05/29 14:09:08

ポイント34pt

100%スクリプト言語ではないですが、その手の変換をする時にはkakasiを使うのが一般的かと思います。

http://kakasi.namazu.org/

id:typos24

ああ、忘れていました。ローカルで動かすのでこれが一番ですね。

ありがとうございました。

2006/05/29 14:18:50
id:hts1004 No.3

hts1004回答回数13ベストアンサー獲得回数22006/05/29 14:18:08

ポイント30pt

Kakasiとかはどうでしょうか?

PerlやRubyのモジュールもあるようです。

Kakasiホームページ

http://kakasi.namazu.org/index.html.ja

はてな-Kakasiとは

http://d.hatena.ne.jp/keyword/Kakasi

id:typos24

どうもでした。

2006/05/29 14:20:28
  • id:villain
    これは回答ではなく、補足なのですが...。

    漢字は日本語の場合、音読みと訓読みがあり、更に前後の文章の
    条件により変わるなど読みが複数あるので完全に正しくローマ字に
    変換することは仕様上、できません(不可能です)。

    この問題は日本語固有のものと考えていいと思います。
    (中国語や韓国語などでの漢字はごく一部の例外を除いてほとんど
    読みが同じ、中国語は方言毎に異なるが同じ方言では同じ漢字は
    同じ読みをする場合が多い)

    ひらがなやカタカナは助詞の「は/ハ」「へ/ヘ」以外はほぼ一対一
    で対応しているのでできると思います。
    (ヘボン式で変換するか日本式で変換するか訓令式で変換するか等に
    よって多少異なります)
  • id:moonwolf
    http://mecab.sourceforge.jp/
    MeCabを使うとkakasiよりも精度良く、日本語→ひらがなの変換ができます。

    UTF-8にも対応しているので、元の文字コードがUTF-8の場合に変換が不要になり、すっきりします。

    ひらがな→ローマ字変換もMeCabで可能です。
    http://mecab.sourceforge.jp/dic-detail.html

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません