検索条件の入力欄や検索ボタンを自分のサイトのページに置けて、自分のサイトのみを横断的に検索する機能が欲しいのです。
見た目上のイメージでは、楽天さんのTOPにある検索の様に、プロダウンで検索する場所を特定(すべてを対象もありえる)して検索ワードを入力して検索するイメージが希望です。
ワードの部分一致or完全一致が選べるのが希望です。
ワードの完全一致とは、「プリン」で検索した時に、「スプリング」は対象にしたくないという意味です。
回答いただける時には、上記機能の実現可能性およびその他売りの機能があれば記入してください。
Googleで検索対象を絞るのが一番手っ取り早いです。
クロールが来るのを待てなかったり、ちょくちょく更新するのであれば、Namazuを入れてローカルで複数サイトのインデックスをつくるのが現実的な方法だと思います。
個人で複数のサイトを検索対象にしようとすると何かと面倒なので、N-gramよりも形態素解析の方が向いています。
ワードの部分一致or完全一致 が難しそうなので、答えを保留していたのですが、
「幅広く検討」ということですので、参考をださせてもらいます。
参考URLに入れた「KISS-Search」では
複数のホストインストールして、分散検索を行ない、結果をまとめて表示するプログラム「Meta Search」という機能があります。
サンプルではプルダウンではなくてチェックボックスですが、イメージに近いのではないでしょうか?
(念のため参考URLにサンプルURLも入れておきます)
また、メタサーチエンジンの「メッチャ検索エンジン」でもドメイン指定機能がありますので、
お望みの機能が実現できるかもしれません。
「トップページ」>「ヘルプ」にソースコードがあります。
http://bach.istc.kobe-u.ac.jp/metcha/
Metcha Search Engine (Meta Search Engine)
ありがとうございました。いただいたURLをいろいろ見てみます。ざっと見た感じ、要件にマッチした部分もありましたが、投稿の際に書いてなかったのですが、数千ページを対象にした検索を行いたいです。リクエスト数も結構あると思います。商用利用です。そういった面からはKISS-Searchでは難しいかも知れません。
情報ありがとうございました。
やっぱ、GOOGLEでしょう。
下のWWW.HOGE.JPの部分をプルダウンにすればOKです。
もちろん小文字です・・。ブログの場合はSHIFT_JISでなくてUTF-8です。
<form action=”
”>
<input type=”hidden” name=”hl” value=”ja”>
<input type=”hidden” name=”hq” value=”inurl:WWW.HOGE.JP”>
<input type=”hidden” name=”ie” value=”Shift_JIS”>
<input type=”hidden” name=”oe” value=”Shift_JIS”>
<input type=”hidden” name=”filter” value=”0”>
<input type=”text” name=”q” size=”30” maxlength=”256” value=””>
<input type=”submit” name=”btnG” value=”このサイトの検索”>
</form>
ありがとうございます。具体的に書いていただき助かります。
ありがとうございます。Google・Namazu以外にもありましたら回答お願いします。
幅広く検討してみたいです。