人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

以下の条件を満たすサイトを作ろうと思います。アイデアを教えてください。

・自動生成可能なコンテンツであること(当方プログラマーです)
※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。
・生成したコンテンツは検索エンジンにヒットすること
※トップページだけでなく各コンテンツが検索結果にヒットすること(そうしないとサイトが存在していること自体、誰にも分からない為)
・誰かの役に立つ情報であること

例えば以下のようなケースが考えられますが、具体的にどのようなテーマが候補としてあり得るか教えて下さい。
・他のWebページの情報を分析、加工、集計した情報を表示するサイト
⇒どのようなデータを分析するのか等、教えていただけると助かります。
・著作権フリーの文章を分類して表示するサイト
⇒どこからそういった情報を取得するのか等、教えていただけると助かります。
・その他自動生成可能なコンテンツ
⇒その他ございましたら教えてください。

当方プログラマーのため文章は得意ではありませんがプログラミングには自信があります。
特技を生かして作れるもので挑戦したいと考えています。

●質問者: capitarize
●カテゴリ:インターネット ウェブ制作
○ 状態 :終了
└ 回答数 : 5/5件

▽最新の回答へ

1 ● tak
●200ポイント

・生成したコンテンツは検索エンジンにヒットすること

これはただ単にサイトマップ作るだけで十分だと思いますが....

・著作権フリーの文章を分類して表示するサイト

著作権フリーなのは青空文庫などですが、
http://www.aozora.gr.jp/
しかし、分類して表示すること、が目的ならば
著作権がない文書にこだわる必要はありません。
http://www.law.co.jp/okamura/copylaw/chyo04.htm


・他のWebページの情報を分析、加工、集計した情報を表示するサイト

個人的に一番興味がある対象は、
レビューサイトからopinion spamを特定する とかですね。
文面の胡散臭さ とか...これは怪しい、というのを自動的に判定したいです。


capitarizeさんのコメント
青空文庫の文章でGoogle検索すると検索結果に多数表示されました。 taroeさんが回答しておりますとおり、既に検索エンジンが認識しているコンテンツのコピーコンテンツだと検索結果から除外されてしまうのも時間の問題のため、検索エンジンが認識していない著作権フリーの文章を教えていただきたいです。

takさんのコメント
それって結局、自分ではコンテンツを作らずに 他のコンテンツを自分の著作物であるかのように見せたいってだけなんですか? 返信の文面だとそのようにも解釈できますが それで ※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。 とは、 結局同じじゃないですか? もちろん、著作権は問題なく、 検索エンジンにも有用である という主張は、確かにそうなのかも知れないのですが

capitarizeさんのコメント
>それって結局、自分ではコンテンツを作らずに >他のコンテンツを自分の著作物であるかのように見せたいってだけなんですか? →著作権があるコンテンツについては、分析、集計、加工等を施すことでオリジナルコンテンツにしたいと考えています。 >※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。 と結局同じじゃないですか? →著作権が無いコンテンツについては、コピーで問題無いと考えていますが、検索エンジンに有用であることが条件となります。

2 ● taroe
●200ポイント

Q&Aサイトの質問文を利用して
それに関係ある情報を集めてくる


質問というものは同じものが数ヶ月おきに同じものが現れがちですし
また回答する人は、そうであっても回答しています。

関連情報は、回答する人に利用されると思います。


ただ、自動生成系のサイトは最初は検索エンジンにインデックスされることが
多いですが、しばらくするとランクが下がるか排除されます。

自動生成系に、ユーザーがフィードバックする仕組みなどを組み込んで
ただの自動生成系でサイトにしていかないと
質問文を満たすサイトにはなりえません。

そうでないと
インデックスされるけど
検索結果の本当の最後の方に表示されるとかになりがちですよ。

そうなると事実上、インデックスされていないのと同じ。


capitarizeさんのコメント
関連情報を集めてきてもおっしゃる通り検索エンジンに表示されません。 検索エンジンの検索結果から除外される仕組みはご認識の通りです。 要は、検索エンジンにオリジナルコンテンツと判断してもらえなければ検索結果には表示されません(正確には、時間が経つと除外され表示されなくなります)。 そのため、質問では分析、加工、集計と書きました。 分析、加工、集計方法に関して自然な文章を作る妙案(怪しい情報商材が薦めている方法やマルコフ連鎖だと人間が見て明らかに不自然な文章になるため、それ以外の方法)がありましたら教えていただけると幸いです。 質問文を利用してそれに関係ある情報を集めてくるサイトとした場合、Googleのパンダアップデートにより、コピーコンテンツと判断され、ユーザーのフィードバックが集まる前にスパムサイトとして検索結果から除外されてしまいそうで心配です。。。

3 ● mododemonandato
●200ポイント

今なら流行している2ちゃんねるまとめサイトがいいかもしれません。
テンプレつきのスレならそのまま役に立つ文章が入っています。
http://www.2ch.net/

健康法とか、ダイエットなどの体験による経験知を集めると役に立つサイトになるでしょう。

はてなキーワードのように最初は自動で作って、後から文章などを入れたものは検索にもヒットしています。
しかも10位以内のものも多いようです。
もはや検索からは除外される完全自動生成に拘らず、マクロなどを活用して後からちゃんと文章、タグ、リンク、タイトルをつける半自動にすると良いかもしれません。


4 ● 蝸牛角上争何事
●200ポイント

流行りのキーワードと特許情報を結び付けたようなサイトはいかがでしょうか。
特許情報を公開しているサイトは幾つかありますが検索機能はお世辞にも優秀とは言えません。
特許情報を構文解析したうえで検索できるだけで有用かと存じます。

流行りのキーワードは検索サイトなどで公開されていると思いますのでそちらの情報と特許番号もしくは概略情報と詳細情報へのリンクを作成するページがあれば特許を取るためにネタを探しているようなビジネスマンは少なくないと思いますので便利なのではないかと思います。

検索エンジン対策はそれほど難しいことではないと思います。
コンテンツの内容までチェックされているとは思えません。
URLが静的リンクになっていることとヘッダのLast-Modifiedが常に最新では無くコンテンツ作成時期と思われる日付固定になっている程度で対策できると思います。


5 ● nokonoko12
●200ポイント

http://www.law.co.jp/okamura/copylaw/chyo04.htm

関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ