人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

タイトルをコピペしたブコメを非表示にしたいです。どのようなアルゴリズムが適しているでしょうか?
目的は、はてなブックマークにおけるコメントの内、その人の考えが余り反映されていないコメントを非表示にすることです。
ブコメを目視で観察(http://b.hatena.ne.jp/entry/matome.naver.jp/odai/2131632919918955401)してみると、そのようなブコメにはタイトルをコピペしたものが多かったため、表題の事を質問させて頂きました。
文字数が足りないので、質問の続きはコメント欄に追記致しました。

●質問者: al001
●カテゴリ:はてなの使い方 コンピュータ
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● ぱこち
ベストアンサー

回答がまだついていないようなので、思い切って回答させていただきます。

書いてはみたものの、こんなのでいいのかなと引っ込み思案気味になって一旦しまったものです。


例示されたエントリをそのまま例に取ると、大体こんな事をやってます。

  1. 「無料で」「学」「べる」「優良英語」「サイト」「まとめ - 」「NAVER 」「まとめ」で区切ります。
  2. 「無料で学」「学べる」「べる優良英語」「優良英語サイト」「サイトまとめ - 」「まとめ - NAVER 」「NAVER まとめ」のように結合して配列にしまいます。
  3. 各コメントでこの文字列を検索して、何割かヒットしたら、タイトルの一部が含まれているとみなします。
  4. 意見 (そこそこの文字数で独自の語が入っている文字列) とタイトルを併記している人をフィルタリングしないよう、最初に区切った語をコメントから消去していって、残った文字数を数えて判定します。

いくつもの文字列を切ったり消したり探ったりしているので、もしかしたらちょっと重いかもしれません。

(例示されたエントリで実行したら、体感としては一瞬でしたが、他の環境でもそうだと言い切れる自信はありません。)

もし重かったら、最初の処理 (タイトルの一部が含まれていると判定するまでの処理) ははしょっても良いかもしれません。


あと、この方法は「ほげほげをほげほげしてほげほげすると・・・」みたいなひらがなだけで構成されたタイトルにはめっぽう弱いです。


Greasemonkey 用のユーザスクリプトをまだちゃんと書いたことが無いので、どれくらい使いまわせるかは未知なのですが、参考になれば嬉しいです。


al001さんのコメント
pacochiさん またまたご回答ありがとうございます!お返事大変遅くなってしまい申し訳ないです; なるほど!文字種で分割するのですね!この方法なら一文字ずつ分割する必要が無いので高速に処理が出来そうですね。 ブックマークレットまでありがとうございます。実際に使ってみたら結構な精度で非表示にできました! この方法を使わせていただこうと思います。本当にありがとうございました _ _
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ