blogサービスを開発したのですが、アダルトキーワードを含む日記をサーバで判別したいです。

・既存の方法の列挙
・あなたのやっている方法

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/08/27 11:27:57
  • 終了:--

回答(2件)

id:alcus No.1

alcus回答回数85ベストアンサー獲得回数02004/08/27 11:43:31

ポイント25pt

http://www.amazon.co.jp/exec/obidos/ASIN/4838713592/

Amazon.co.jp: 官能小説用語表現辞典: 本: 永田 守弘

http://www.amazon.co.jp/exec/obidos/ASIN/4309012523/

Amazon.co.jp: 性語辞典: 本: 柴田 千秋

とりあえずは、本文中にこれらの単語がでてくるかどうかチェックする、とかですかね。

id:kunitz

ありがとうございます!

aclusさんはその方法でやられている?

2004/08/27 11:55:05
id:tomapd No.2

tomapd回答回数1ベストアンサー獲得回数02004/08/28 16:46:27

ポイント25pt

http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm

グーグル、インテル、MSが注目するベイズ理論:スペシャルレポート - CNET Japan

http://www.forest.impress.co.jp/article/2004/03/17/popfile.html

窓の杜 - 【Review NEWS】“ベイズ理論”をもとに迷惑メールの対策ができるPOPプロキシー「POPFile」

誰かがやっているかどうか不明ですし、やっていそうな気もしますが、スパムフィルタにも使われているベイズ理論を応用してみるというのはどうでしょうか。

アダルトキーワードと判別するというより、その日記がアダルト関連であるかどうかを判別することになると思いますが。

スパムメールの判断基準としては、単語などがキーとなると思いますが、日記の場合ですと単語(文章)の他に、表示している画像の名前、日記からリンクしているサイト、また日記を参照しているサイト(リファラー)などが有効かと思います。

実際に実装するのは難しそうですし、ベイズ理論を用いるので最初の頃は管理人自身がアダルトかどうかを判別してフィルタに学習させなければならず、またどんなに学習させても100%判別できるわけではないのですが。

id:kunitz

ありがとうございます!

ベイズ理論

2004/08/28 21:28:17

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません