人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

伏字で隠された文字を解読するサービス( http://fuseji.net/ )
に検索結果のスコアリング機能を付けました。

頭の中で考えていた結果が得られたかどうか教えてください。

質問の意図は直感的な結果が出ない場合のケースを知って
スコアリング方法を改善したいというところです。

面白い/面白くないなど感想だけでも頂けると助かります。

●質問者: にゅう おん わん
●カテゴリ:インターネット ウェブ制作
✍キーワード:サービス スコアリング 伏字 意図 感想
○ 状態 :終了
└ 回答数 : 34/34件

▽最新の回答へ

[1]ミス○ karuishi

ミス○で検索するとグラフに「ミスチEミスド」と出ます。


[2]「ー」の扱い karuishi

スタ○、ホラ○のような「ー」が入るのがメジャーな場合はグラフが画一的


[3] 伏字・誤字・欠字 ? 誤認識の修訂に活路あり ? adlib

OCR(文字認識)で、「ウアィオりソ」など、あきらかな誤変換を

学習させるには、かなり高度な(高価な)ソフトを必要とします。

実は、しばしば原文の印字状態が原因であるにもかかわらず……。

わたしは、原則として手を加えずに「OCRのママ」と注記していま

すが、あまりに目ざわりで煩雑な場合、あるいは元の資料を失ったため、

どうしても正しい文字を特定したいケースもあります。

エクセル上での置換手順は、かなり進化していますが、数字に対して

敏感すぎるため、わざわざ「秀丸」や「紙copi」などのエディタに移動

しています。この方向で、画期的に応用できるかもしれませんね。

http://d.hatena.ne.jp/adlib/20080823

↑読込革命 ? 終の本棚 ? ↓OCR

http://www.enpitu.ne.jp/usr8/bin/search?idst=87518&key=%A3%CF%A3...


[4]面白い gtore

です!

だいたい思ったとおりになります。


[5]これは suko1008

○←これしか対応していないとやりずらいと思います


[6]>5 感想は suko1008

これは「合っている」「合っていない」ではなく、「「太郎」と思って入力したら「五郎」とでたーーーww」のような意外性があっったりしてどんどん検索してみたくなりますね。


[7]>6 それと suko1008

これ今気づいたんですが伏字が何個あっても出てくるのが凄いですね!!面白いです!


[8]>7suko1008

伏字検索○○○

伏字で隠された文字を解読します.

惜敗 → ??? ←これってどういう意味ですか??

「○○」はたぶん

「日本」です.

128件hit (0.02735秒)

○○の候補は複数見つかりました.

日本 [w] [h] [y]

放送 [w] [h] [y]

発売 [w] [h] [y]

作品 [w] [h] [y]


[9]>1 ミスチEミスド newonone

あれ、ほんとうですか。

試してみたところ大丈夫そうです。


[10]>4 ありがとうございます newonone

元気が出ます


[11]>8 後他にも不具合が suko1008

伏字検索○○○

伏字で隠された文字を解読します.

父の○ プレゼント → ???

↑をクリックすると



伏字検索○○○

伏字で隠された文字を解読します.

全○オープン → ???

「父の○+プレゼント」は

解読できません.

となります。

漢検 → ??? とか、伏字がないものも出てきます。


[12]>2 グラフが画一的になるのはきっと newonone

スタ○の候補である「スター」が他の候補に比べ

強すぎるからだと思います。


[13]>5 伏字文字は newonone

○●@が伏字になります。

@が入力しやすくてお勧めです。

■とか□も対応したほうがいいですかね。


[14]>3 活路 newonone

ありがとうございます。

誤変換、誤認識の修正については思いつきませんでした。

機能追加時のヒントになりそうです。


[15]>11 お、バグです、 newonone

ご指摘の通りです。

例として、Googleの急上昇ワードを

自動的に伏字にしています。

伏字化のロジックガが良くないので

近いうちに修正したいと思います。


[16]>7 サンプルがよくないですね newonone

はい。伏字が何個あっても大丈夫です。

サンプルを改善しようと思います。


[17]>10 面白半分で… gtore

「○○○○○○○○○○○○○○○○○○○○○○○○○○○○○よ」

で検索したら、

「そう、あたしたちはこんなにも理不尽な世界に生きているのだらよ」

が出てきました!


すごいサービスですね。

いやぁ、これは新知識発掘に役立ちもします。


[18]>15 修正しました newonone

修正が終わって今リリースしました。


[19]>17 意外すぎた s_mori

「○○○○を○○○○○○○○○○」

はおそらく

「牛に願いを_Love&Farm」

です.

2007年放送の連続テレビドラマらしい・・


[20]伏字検索○○○ Mars

「伏字検索○○○」を検索すると結果表示がおかしくなるようです。

(フッターだけの表示になる)

「伏○検索」が解析できませんって結果になるのは悲しいけど仕方ないのかな(苦笑)


[21]>20 コメント追加 Mars

スコアリング追加、とってもいい感じです。

グラフで表示されるととても説得力があります。

あと、Google Chart API側の不具合だとは思うけど

○○○○を○○○○○○○○○○」を検索した時に、

円グラフの脇に飛び出る要素名(?)が複数の検索結果に対して一つしか表示されないですね。


[22]>20 バグです、修正しました。 newonone

Marsさん凄いです。

伏字のサービスを作ったんだから

サービス名も伏字にしちゃって正式名は

検索すると出てくるようにしていました。

いつか誰か気が付いてくれる日が来るかと。

バグの内容はグラフを作るために点数/総得点

をする際に0除算していました。お恥ずかしい。


[23]>21 こちらもバグです。修正しました。 newonone

具体的なケースを教えてもらって助かります。

バグでした。

Google Chart APIに渡す文字列をちゃんと

escapeしてあげたら治りました。


[24]>9 再現しました。 newonone

別のデータで1回再現しました。

Google Chart APIに渡す文字列をちゃんと

escapeするようにしました。

これで治ったのかなと思います。


[25]>4 アニメや漫画とか見ている時に・・・ http4799

びっくりしました!

試しに、「チョ○エッグ」で検索してみたら・・・

ちゃんと元の言葉が出てきました!凄いです!

今のところ、全部思った通りに出てきます。

お気に入りに入れておきます。


[26]>22 びっくり Mars

何気なしに検索したんですがそんな秘密があったんですね。

検索結果画面でもっと自己主張してもいいかも。

今現在、検索フォーム上の「例」が表示されなくなってます!


[27]>26 たしかに newonone

> 今現在、検索フォーム上の「例」が表示されなくなってます!

表示されなくなっていました。

Googleの急上昇ワードを1時間おきに拾っていますが

アクセスできなかったようです。

アクセスできなかった場合は例のデータを更新しない

ようにします。


[28]なぜか dacks1

「おだかず○さ」が解読できませんでした。ひらがなだからかな?


[29]>28 はい。その通りです。 newonone

はてなキーワードには、ふりがなが付いていますので

辞書に入れてしまうことも可能です。

検討してみますね。


[30]>25 Wikipediaのデータで学習させたので newonone

アニメや声優さんに強いようです。

○○奈々


[31]提供データが多すぎる I11

リンク先の情報を全候補分持ってきてアンカーコメントで表示させるのって、どうなのかな? 提供データが多すぎます。(はてなキーワードのコンテンツって、誰でもいくらでも自分のサイトのデータとして表示させてもいいんでしたっけ?)

リンクされているのですから、リンク先のデータを持ってくる必要ないのでは? データが欲しければ自分でリンクから飛べばよいわけで、リンクから飛ぶ前にデータを持ってきて表示させるのは余計お世話です。トラフィックのムダ。

Googleのトップページみたいに、必用な機能以外なにも置かないのがベストです。シンプル・イズ・ベスト。情報は必要なときに必用な時だけ、が原則。

解読できない言葉もやはりありますね。

たとえば最近近所にできたお店の名前とか、方言とか。

利用者が解読できない言葉に直面した時のために、「言葉を知らせる」機能をつけて、候補がヒットしないときに情報を入力できるようにしては?


[32]>31 データの取得タイミングについて newonone

はてなキーワードは公開されているキーワードデータ

のみCSV形式でダウンロードしています。2週間に1回くらい。

マウスオーバーしたときに表示されるのは

Wikipediaのデータです。

こちらもXMLでダウンロードしたものを使っていて

リンク先のデータを取得して表示しているわけではありません。クロール禁止ですし。

表示方法がいまいちで誤解を与えてしまったようです。

シンプルにはしたいですね。機能を追加する毎に

ごちゃごちゃしてきたような気がします。

解読できない場合は改善の余地がありますね。

「もしかして?」みたいな機能は追加したいです。


[33]>29 対応してみました newonone

ひらがなの検索に対応してみました。


[34]>32 シンプルに newonone

シンプルにするため思い切って変更を加えました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ