人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

blogサービスを開発したのですが、アダルトキーワードを含む日記をサーバで判別したいです。
・既存の方法の列挙
・あなたのやっている方法

●質問者: kunitz
●カテゴリ:ビジネス・経営 コンピュータ
✍キーワード:blog あなた アダルト キーワード サーバ
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● alcus
●25ポイント

http://www.amazon.co.jp/exec/obidos/ASIN/4838713592/

Amazon.co.jp: 官能小説用語表現辞典: 本: 永田 守弘

http://www.amazon.co.jp/exec/obidos/ASIN/4309012523/

Amazon.co.jp: 性語辞典: 本: 柴田 千秋

とりあえずは、本文中にこれらの単語がでてくるかどうかチェックする、とかですかね。

◎質問者からの返答

ありがとうございます!

aclusさんはその方法でやられている?


2 ● tomapd
●25ポイント

http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm

グーグル、インテル、MSが注目するベイズ理論:スペシャルレポート - CNET Japan

http://www.forest.impress.co.jp/article/2004/03/17/popfile.html

窓の杜 - 【Review NEWS】“ベイズ理論”をもとに迷惑メールの対策ができるPOPプロキシー「POPFile」

誰かがやっているかどうか不明ですし、やっていそうな気もしますが、スパムフィルタにも使われているベイズ理論を応用してみるというのはどうでしょうか。

アダルトキーワードと判別するというより、その日記がアダルト関連であるかどうかを判別することになると思いますが。

スパムメールの判断基準としては、単語などがキーとなると思いますが、日記の場合ですと単語(文章)の他に、表示している画像の名前、日記からリンクしているサイト、また日記を参照しているサイト(リファラー)などが有効かと思います。

実際に実装するのは難しそうですし、ベイズ理論を用いるので最初の頃は管理人自身がアダルトかどうかを判別してフィルタに学習させなければならず、またどんなに学習させても100%判別できるわけではないのですが。

◎質問者からの返答

ありがとうございます!

ベイズ理論

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ