単漢字の読みをダウンロードできるサイトを教えて下さい.CSV,Exel形式などで,シフトJISの全ての漢字,できればJIS X0213の範囲までカバーしていると嬉しいです.

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2006/04/13 10:41:24
  • 終了:2006/04/15 14:45:31

ベストアンサー

id:tmasao No.5

tmasao回答回数77ベストアンサー獲得回数202006/04/15 01:20:39

ポイント50pt

# 2度目ですいませんが。

加工が面倒ということでしたので、以下に単純に加工したものを置いておきます:

http://masao.jpn.org/etc/Unihan-kJapaneseOnKun.txt.gz

こんなんでよければ…。

PS. 世の中にはもっとまともな漢字辞書が転がってる気がしますが。

id:salon_hiyake

素晴らしいです! このようなものを望んでいました.

ローマ字からかなに変換までしていただけるとは.どうやって加工したのか知りたいです.

2006/04/15 14:39:01

その他の回答(4件)

id:tmasao No.1

tmasao回答回数77ベストアンサー獲得回数202006/04/13 10:58:54

ポイント20pt

http://www.unicode.org/Public/UNIDATA/

単純なのでよければ、UnicodeのUnihanデータベースにあるUnihan.txtのkJapaneseOn, kJapaneseKunなどのプロパティが音訓情報として載っていると思います。

(例:Unihan data for U+795E

id:salon_hiyake

これは知っていたのですが,加工するのがすごく大変そうです.読みがローマ字なのもちょっと.

2006/04/13 11:18:28
id:aoinatsunosora No.2

aoinatsunosora回答回数131ベストアンサー獲得回数72006/04/13 15:09:03

ポイント20pt

http://dictionary.www.infoseek.co.jp/?gr=kj

こういうサイトですか?

id:salon_hiyake

基本的には読みが調べらればいいのですが,ダウンロードできなければ意味がありません.

2006/04/13 22:06:05
id:aoinatsunosora No.3

aoinatsunosora回答回数131ベストアンサー獲得回数72006/04/13 15:25:53

ポイント20pt

二回目の回答です。さっきは勘違いしてました。

http://www.jca.apc.org/~earthian/aozora/0213.html

このサイトの● allファイル(all0c23.zip,zip圧縮,944k)

にありましたよ。

id:salon_hiyake

確かにこのようなものを探していたのですが,漢字から読みを調べるのにはちょっとつらいです.一つの漢字が持つ,複数の読みを引ける,tmasaoさんの回答のカタカナまたはひらがな版みたいなものはないでしょうか?

2006/04/13 22:20:21
id:s34itl No.4

s34itl回答回数117ベストアンサー獲得回数42006/04/14 11:17:47

ポイント20pt

http://cvs.sourceforge.jp/cgi-bin/viewcvs.cgi/freewnn/FreeWn...

FreeWnnの辞書はどうでしょうか。1漢字1行ではないこと、jis x0213 までカバーしていないことをお断りします。

上記 url の中の tankan.u は jisx0208 の第一水準です。ただし、このオリジナルは読みの順に並んでいます。

例えば excel の tab 区切りで読み込み、D列→A列の優先順で並べ直すと、1漢字に対する読みをまとめることができます。(読みは3文字以下でしたので、D列に漢字が並びます)

(先頭部分=オリジナル)

あ 亜 単漢字 3

あ 唖 単漢字 2

あ 娃 単漢字 1

あ 阿 単漢字 4

あ 吾 単漢字 1

あい 娃 単漢字 0

あい 哀 単漢字 1

(先頭部分=並べ直し後)

か ヵ 単漢字 8

が ヵ 単漢字 1

か ヶ 単漢字 6

が ヶ 単漢字 8

け ヶ 単漢字 10

あ 亜 単漢字 3

あ 唖 単漢字 2

おし 唖 単漢字 0

あ 娃 単漢字 1

あい 娃 単漢字 0

以下のurlで、tankan2.u は jisx0208 の第二水準、tankan3.u は JIS X 0212 補助漢字です。この2つは漢字順に並んでいます。

http://cvs.sourceforge.jp/cgi-bin/viewcvs.cgi/freewnn/FreeWn...

(先頭部分)

いち 弌 単漢字 1

いつ 弌 単漢字 1

はじめ 弌 単漢字 1

かい 丐 単漢字 1

かつ 丐 単漢字 1

こ 丐 単漢字 1

http://cvs.sourceforge.jp/cgi-bin/viewcvs.cgi/freewnn/FreeWn...

参考になれば幸いです。

id:salon_hiyake

残念ですが,ほとんど音読みばかりで訓読みは登録がありません.これは誰がどのような目的で入力したデータなのでしょうか?

2006/04/14 21:02:51
id:tmasao No.5

tmasao回答回数77ベストアンサー獲得回数202006/04/15 01:20:39ここでベストアンサー

ポイント50pt

# 2度目ですいませんが。

加工が面倒ということでしたので、以下に単純に加工したものを置いておきます:

http://masao.jpn.org/etc/Unihan-kJapaneseOnKun.txt.gz

こんなんでよければ…。

PS. 世の中にはもっとまともな漢字辞書が転がってる気がしますが。

id:salon_hiyake

素晴らしいです! このようなものを望んでいました.

ローマ字からかなに変換までしていただけるとは.どうやって加工したのか知りたいです.

2006/04/15 14:39:01
  • id:tmasao
    > ローマ字からかなに変換までしていただけるとは.どうやって加工したのか知りたいです

    http://masao.jpn.org/etc/unihan-onkun.html
    に説明を書いておきましたが、適当なスクリプトと既存のライブラリ(Ruby/Romkan)を使っただけです。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません