http://www.su-jine.com/sujine_seo_site_concept.php
自分でやろうSEO (ゼロからのアクセスアップ) > ページテーマチェックツール - Su-Jine
ページ内の単語や外部からのリンク内容を見ているのではないかと思います。
JavaScriptでは難しいと思います。
形態素解析という文章を単語単位に分割する手法があります。
恐らくこのような手法で名詞を抜き出し、自身の持つデータベースとマッチングしているのだと思います。
JavaScriptでも可能かもしれませんが、DBをクライアントにダウンロードさせるのはこくなので、結局サーバ側にアクセスする手段が必要になると思います。
JavaScriptって・・・サーバサイドの話じゃないですよね?
形態素解析というのですね!初めて知りました。
それを独自で作ったらかなり膨大なDBになりますよね…。
しかも、読み込む際かなりの時間になりそうで…。
フリーのCGIなどで似た様なのがあれば便利なのですが…。
http://d.hatena.ne.jp/keyword/Ajax
Ajaxとは - はてなダイアリー
Googleのサーチエンジンロボットが巡回した折に、インデックスを作成しており、その際に、サイトのキーワードを自動判別しています。そして、実際にGoogle Adsenseが掲載されているページが表示された際には、その膨大なサイトのURLとキーワードが対になって格納されているデータベースにアクセスし、ふさわしいページを表示しているのだと思います。
ですから、Googleのロボットがサイトを巡回することを許可していなければなりません。robots.txtを何も設置していないのであれば問題ありませんが、ロボットの巡回を拒否している設定をしている場合はGoogleだけでも許可する必要があります。
では、どのようにデータベースから引き出されたコンテンツを表示しているかといいますと、Javascriptをフル活用したAjaxという技術を用いています。詳しくは参照URLをご覧ください。
http://www.openspc2.org/JavaScript/Ajax/
Ajax : 勉強用サンプル&解説
https://www.google.com/support/adsense/bin/answer.py?answer=1053...
Google AdSense Help Center: How do I grant access to your crawler?
巡回した際にその時に自動判別して居るんですね。
Ajax…是非今から勉強して利用してみたいと思います。
レンタルサーバーでも利用出来るのか…ちょっと心配ですがw
貴重な情報本当にありがとう御座います。
引き続き回答を待て見たいと思います。
私も外部からソースを解析して単語を判別していると思います。
しかし、具体的にどうやって解析しているのか知りたいんです。
やはりJavaScriptでは無理ですよね…(^_^;
CGIとかになるのかな……。
Sampleとかあれば教えて頂きたいです★