人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

自然言語処理についてです.

開発環境: JAVA

日本語の形態素解析システムとしてSEN(http://ultimania.org/sen/)を使用していますが,
固有名詞抽出にはあまり性能が良くないです.

SEN以外のモジュールは使用せずに,固有名詞抽出の性能をよくする方法を教えて下さい.

SENの辞書ファイルを拡大する方法は分かっていますが,その場合も新しい固有名詞の辞書ファイルが必要になるので困っています.

よろしくお願いいたします.

●質問者: bsavas
●カテゴリ:コンピュータ
✍キーワード:Java Sen システム ファイル モジュール
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● r315
●40ポイント

http://www.hatena.ne.jp/1142055422#

人力検索はてな - 自然言語処理についてです. 開発環境: JAVA 日本語の形態素解析システムとしてSEN(http://ultimania.org/sen/)を使用していますが, 固有名詞抽出にはあまり性能が良..

URLはダミーです。

他の形態素解析エンジンを使用したとしても辞書に登録されていない限りは未知語扱いであるため、辞書の精度をあげるのがよいのではないでしょうか?


固有名詞を入手する手段として、ATOK17からだと辞書ツールから固有名詞一覧をファイル出力することが可能ですので、そのファイルをSEN形式の辞書に変換して使用すればいいと思います。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ