自作の文章生成系プログラムのマスタデータとして、国語辞典級の量のデータが欲しく思います。表記と読みと品詞分類?くらいのデータでプログラムで取扱いのしやすいような形式の辞書データを配布もしくは販売しているところをご存じないでしょうか。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2011/09/28 14:55:10
  • 終了:2011/10/05 15:00:03

ベストアンサー

id:Jupiter2100 No.1

じゅぴたー回答回数444ベストアンサー獲得回数742011/09/28 15:04:26

ポイント100pt

オープンソースの形態素解析用辞書「NAIST Japanese Dictionary」はどうでしょう。

見出し語、読み、品詞がセットで入っています。

見出し語数は約48万語です。

id:shinp

以前mecabを導入するときにインストールしたことがあるのですが、これからマスタデータを抽出する方法が…全く分からない…なんかが詰まってるのだけは分かるんですけどね。

2011/10/06 01:02:18
  • id:TAK_TAK
    300万語ぐらいのデータならばわたくしが持っています。
    品詞、読みが、正しいかどうか検討していませんが

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません