【人力検索のスキル向上】検索エンジンで、通常検索できない、インターネット上のHTMLのTAG内文字列、例えばALTやヘッダー文字列のリンク、リフレッシュなどのコメント文も含めて検索する方法を教えて下さい


yahoo!などの検索サイトを使ったやり方でも構いません

[はてなダイアリーキーワード]で検索をしようと思ったのですが、登録されてない文字は検索できないのですね

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/09/25 15:07:22
  • 終了:--

回答(6件)

id:matsu2004 No.1

matsu2004回答回数13ベストアンサー獲得回数02004/08/21 15:54:56

ポイント5pt

http://www.bayashi.net/st/pdmemo/seo.html

技林/アクセス解析CGI

alt属性をどのロボットが見ているかどうか、までは言及していませんね。。

http://robot-simulator.seo-tool.jp/index.html

検索エンジンロボットシミュレーター | 住 太陽の「SEO 検索エンジン最適化」

「検索エンジンロボットシミュレーター」などを使ってみると、どんな「閲覧のされ方」をするのか、転じて、どう検索(閲覧)していったらいいのか、がわかるかもしれませんね。

以上中途半端な回答ですが・・

id:aki73ix

検索方法はしってるんですけどね

検索結果の中から抽出できたらいいのですが、それができるものってなかなか無いみたいなのです

そういえば、句読点で検索しようとしても無視されますよね・・・句読点含めて検索したいときに不便なんですよね

2004/08/22 22:48:09
id:gb2 No.2

gb2回答回数18ベストアンサー獲得回数02004/08/28 18:37:56

ポイント5pt

多くの一般の検索エンジンでは、外部公開されているフォームからRaw-HTML内の検索は行えません。

検索する際、それらを対象に含めるとすると、検索対象が膨大になりすぎるためです。

さらに、普通はそれを検索対象とすることはないためです。

なので、登録の際に、キャッシュとは別に、検索対象DBにユーザが”見える”範囲のみをインデクサします。

img内のaltはインデクサされることが多いですが、それのみを検索対象とするオプション等は見たことがありません。

id:aki73ix

確かにそうなんですよね

その、例外的な検索エンジンってないですかね?

しかし、句読点などを含めて検索できないのが疑問だったりします

2004/08/29 17:27:22
id:kuippa No.3

くいっぱ回答回数1030ベストアンサー獲得回数132004/09/01 18:43:20

ポイント15pt

http://hw001.gate01.com/kzsoft/

Web自動巡回型ダウンロードツール「WebFCS」

TAG内文字列とか、コメント文字列まで検索でひっかるようになったら、

自分のホームページは恥ずかしくてソース直さなきゃいけないことに…

こんな難しい質問をするのは誰だろと、思ったら…

akiさんですか、これ以上スキル向上させてどうするんだろとかも思いますが。

それはさておき。

登録されていない文字について検索するという方法として考えられるのは、

消極的手法としては類語検索なんてどうでしょうか。

実用的ではないかもしれませんが…、

類語を引き当てるにはいいかもしれません。

http://hw001.gate01.com/kzsoft/

Web自動巡回型ダウンロードツール「WebFCS」

AltやTagなどの検索については、おそらく検索エンジンのロボットも

インデックスは作ってないとおもいますので、

自分で収集しなければいけないと思います。

(そう言えばかなり昔はロボット検索のやつは出てましたね…)

1.自動巡回ツールなどで関連キーワードのサイトを一括取得。

(これが一番難しいかもしれませんが…、ここで類似検索を使う手もあります)

2.ナマズなどの全文検索エンジンをつかってindex化。

(もしかしたら、日本語ワカチ書きをベースに構成されているので、

TAG内検索などの設定を自作しなくてはいけないかも…)

3.あとは検索。

1のサイズが増えれば増えるほど2のindex化に時間がかかるかと思います。

id:aki73ix

ありがとうございます

サイト内のみタグ検索も出来るというものは結構あるんですけどね^^;

自分で検索エンジンを作るのも、ハードディスクが、あれば構わないのですが全部合わせても100Gに満たないので、データベース構築の段階で無理がありますね(^^;

後は、句読点や記号をキーにくわえる方法も募集しています

2004/09/01 18:52:10
id:kuippa No.4

くいっぱ回答回数1030ベストアンサー獲得回数132004/09/01 18:48:10

ポイント5pt

http://www.gengokk.co.jp/thesaurus/

シソーラス(類語)検索

む。投稿後自分のURL引用の間違いに気が付きました。

ソーシラス検索はこちら。

お詫びに自分の検索エンジンリンク集。

もぉだいぶメンテナンスしてないので、ガタガタです。

id:aki73ix

・・ありがとうございます

2004/09/01 18:53:13
id:tarohbin No.5

tarohbin回答回数108ベストアンサー獲得回数02004/09/18 15:59:31

ポイント5pt

urlは役にたたないかも知れません

タグ内に書かれた言葉は(<IMG ALT=”ことば” や <A title=”ことば”) はgoogleの巡回ロボットに読まれているようです。

携帯電話で 

又は 

で調べてみて下さい反映されています。

しかし、絵のかわりに文字などを入れているわけで コメントタグ内(<!--ことば)なども読まれることを前提に作られていない

特に<META のリフレッシュはそこまで!しか読まれないはず。

(<NAME=”description” content=”ことば”)は読まれています。

画像が重いため google 携帯版が解りやすいかも?

id:aki73ix

GoogleはWAP2.0だとちゃんと見えないんですが

携帯版だとどうなるんですかね

うちの携帯だと見れないんです

2004/09/19 13:30:23
id:diabah_blue No.6

diabah_blue回答回数129ベストアンサー獲得回数12004/09/18 19:12:59

ポイント100pt

AAA!Cafeは記号を含めた検索が出来るようですね。

私も以前はてなで質問してみたのですが、それ以外のサイトは見つかりませんでした。

CEEK.JPはメタ検索なのですが、個々のエンジンでは記号を含めた検索が出来ないはずなので、ちょっと怪しいです。

id:aki73ix

あ、素晴らしい

ありがとうございます

2004/10/01 21:38:09
  • id:yoo15x
    Google 携帯版

    回答5のコメントより:
    >GoogleはWAP2.0だとちゃんと見えないんですが
    >携帯版だとどうなるんですかね
    いくつかはパソコンからも見られますよ。

      http://www.google.co.jp/imode i-mode
      http://www.google.co.jp/xhtml WAP2.0
      http://www.google.co.jp/wml WAP1.2

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません