わかりにくいかもしれませんが、よろしくお願いします。


ローマ字直接入力の状態で、かな入力式で打たれたプレーンテキストファイル(1MB程度が数個)をかなに変換する効率のよい方法を知りたいです。(例:fwu→はてな)ただし、半分程度にURLなどのローマ字も含まれていますので、完全に仮名だけではありません。

環境は、WinXP Home SP2、EmEditor Proを持っています。

ツール、エディタのプラグインやマクロだとありそうに思いますが、目から鱗の方法があるかもしれません。

※一般的な置換やgrepでの置換程度は行っています。
※※また、実験的なことなのですが、同程度の内容でしたら遅い回答の配分を増やしてみたいと思いますので、なるべく遅く(深夜頃にチェックします)回答いただきたいです。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/06/19 09:49:00
  • 終了:--

回答(2件)

id:kanetetu No.1

kanetetu回答回数2199ベストアンサー獲得回数112005/06/19 10:21:21

こちらのがいいでしょう。

id:tailliar No.2

tailliar回答回数109ベストアンサー獲得回数02005/06/20 01:14:00

ポイント90pt

URLはダミーです。

私がプログラマからかもしれませんが、そういうプログラムを作るのが一番てっとりばやく感じます。

対応表の入力がちょっと面倒なだけで、非常に簡単にできますので、もしよければご連絡ください。ご相談に乗れるかと思います。

siroutopg@momo-mail.com

id:so_koja

ご連絡先まで、ありがとうございます。

少し検討してみます。

2005/06/21 10:14:07
  • id:cx20
    素朴な疑問。

    単純に「英数字」→「ひらがな」変換だと、
    変換できない文字が出てくる気がします。
    たとえば
    「を」(対応する記号が無い)とか
    「ろ」(「¥」→「ー」で変換してしまう)とか。
    そのあたりは大丈夫なんでしょうか?

    何かしら変換ルールがあるのでしたら、変換できそうですけど。

    <英数字>
    1234567890−^¥
    qwertyuiop@[
    asdfghjkl;:]
    zxcvbnm,./¥

    <ひらがな>
    ぬふあうえおやゆよわほへー
    たていすかんなにらせ゛゜
    ちとしはきくまのりれけむ
    つさそひこみもねるめろ

    <拡張変換(シフト文字も変換)>
    #$%&’()→ ぁぅぇぉゃゅょ
    {}<> → 「」、。
    ZE → っぃ

    ・・・ちょっと気になったもので(汗)(^^A
  • id:so_koja
    そうなんです。

    現在エディタの「置換」で変換しているのですが。ご指摘のような誤変換やURLの一部がたまたま仮名に変換されることもあって、何かツールがあるのでは?と思った次第です。

    いろいろググってみたのですが、見つからなくて…。

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません