以下の条件を満たすサイトを作ろうと思います。アイデアを教えてください。


・自動生成可能なコンテンツであること(当方プログラマーです)
 ※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。
・生成したコンテンツは検索エンジンにヒットすること
 ※トップページだけでなく各コンテンツが検索結果にヒットすること(そうしないとサイトが存在していること自体、誰にも分からない為)
・誰かの役に立つ情報であること

例えば以下のようなケースが考えられますが、具体的にどのようなテーマが候補としてあり得るか教えて下さい。
・他のWebページの情報を分析、加工、集計した情報を表示するサイト
 ⇒どのようなデータを分析するのか等、教えていただけると助かります。
・著作権フリーの文章を分類して表示するサイト
 ⇒どこからそういった情報を取得するのか等、教えていただけると助かります。
・その他自動生成可能なコンテンツ
 ⇒その他ございましたら教えてください。

当方プログラマーのため文章は得意ではありませんがプログラミングには自信があります。
特技を生かして作れるもので挑戦したいと考えています。

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2012/04/08 17:32:09
  • 終了:2012/04/15 17:35:06

回答(5件)

id:TAK_TAK No.1

tak回答回数988ベストアンサー獲得回数822012/04/09 10:00:39

ポイント200pt

・生成したコンテンツは検索エンジンにヒットすること

これはただ単にサイトマップ作るだけで十分だと思いますが....

・著作権フリーの文章を分類して表示するサイト

著作権フリーなのは青空文庫などですが、
http://www.aozora.gr.jp/
しかし、分類して表示すること、が目的ならば
著作権がない文書にこだわる必要はありません。
http://www.law.co.jp/okamura/copylaw/chyo04.htm


・他のWebページの情報を分析、加工、集計した情報を表示するサイト

個人的に一番興味がある対象は、
レビューサイトからopinion spamを特定する とかですね。
文面の胡散臭さ とか...これは怪しい、というのを自動的に判定したいです。

他1件のコメントを見る
id:TAK_TAK

それって結局、自分ではコンテンツを作らずに
他のコンテンツを自分の著作物であるかのように見せたいってだけなんですか?

返信の文面だとそのようにも解釈できますが
それで
 ※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。
とは、
結局同じじゃないですか?

もちろん、著作権は問題なく、
検索エンジンにも有用である という主張は、確かにそうなのかも知れないのですが

2012/04/10 09:37:31
id:capitarize

>それって結局、自分ではコンテンツを作らずに
>他のコンテンツを自分の著作物であるかのように見せたいってだけなんですか?
 →著作権があるコンテンツについては、分析、集計、加工等を施すことでオリジナルコンテンツにしたいと考えています。

>※他人のサイトの内容をそのままコピーするようなスパム行為は除きます。 と結局同じじゃないですか?
 →著作権が無いコンテンツについては、コピーで問題無いと考えていますが、検索エンジンに有用であることが条件となります。

2012/04/10 14:55:22
id:taroe No.2

taroe回答回数1099ベストアンサー獲得回数1322012/04/09 10:15:10

ポイント200pt

Q&Aサイトの質問文を利用して
それに関係ある情報を集めてくる


質問というものは同じものが数ヶ月おきに同じものが現れがちですし
また回答する人は、そうであっても回答しています。

関連情報は、回答する人に利用されると思います。


ただ、自動生成系のサイトは最初は検索エンジンにインデックスされることが
多いですが、しばらくするとランクが下がるか排除されます。

自動生成系に、ユーザーがフィードバックする仕組みなどを組み込んで
ただの自動生成系でサイトにしていかないと
質問文を満たすサイトにはなりえません。

そうでないと
インデックスされるけど
検索結果の本当の最後の方に表示されるとかになりがちですよ。

そうなると事実上、インデックスされていないのと同じ。

id:capitarize

関連情報を集めてきてもおっしゃる通り検索エンジンに表示されません。

検索エンジンの検索結果から除外される仕組みはご認識の通りです。
要は、検索エンジンにオリジナルコンテンツと判断してもらえなければ検索結果には表示されません(正確には、時間が経つと除外され表示されなくなります)。
そのため、質問では分析、加工、集計と書きました。
分析、加工、集計方法に関して自然な文章を作る妙案(怪しい情報商材が薦めている方法やマルコフ連鎖だと人間が見て明らかに不自然な文章になるため、それ以外の方法)がありましたら教えていただけると幸いです。

質問文を利用してそれに関係ある情報を集めてくるサイトとした場合、Googleのパンダアップデートにより、コピーコンテンツと判断され、ユーザーのフィードバックが集まる前にスパムサイトとして検索結果から除外されてしまいそうで心配です。。。

2012/04/10 08:54:22
id:mododemonandato No.3

mododemonandato回答回数759ベストアンサー獲得回数772012/04/13 09:57:45

ポイント200pt

今なら流行している2ちゃんねるまとめサイトがいいかもしれません。
テンプレつきのスレならそのまま役に立つ文章が入っています。
http://www.2ch.net/

健康法とか、ダイエットなどの体験による経験知を集めると役に立つサイトになるでしょう。

はてなキーワードのように最初は自動で作って、後から文章などを入れたものは検索にもヒットしています。
しかも10位以内のものも多いようです。
もはや検索からは除外される完全自動生成に拘らず、マクロなどを活用して後からちゃんと文章、タグ、リンク、タイトルをつける半自動にすると良いかもしれません。

id:mario-16 No.4

蝸牛角上争何事回答回数219ベストアンサー獲得回数212012/04/14 23:41:01

ポイント200pt

流行りのキーワードと特許情報を結び付けたようなサイトはいかがでしょうか。
特許情報を公開しているサイトは幾つかありますが検索機能はお世辞にも優秀とは言えません。
特許情報を構文解析したうえで検索できるだけで有用かと存じます。

流行りのキーワードは検索サイトなどで公開されていると思いますのでそちらの情報と特許番号もしくは概略情報と詳細情報へのリンクを作成するページがあれば特許を取るためにネタを探しているようなビジネスマンは少なくないと思いますので便利なのではないかと思います。

検索エンジン対策はそれほど難しいことではないと思います。
コンテンツの内容までチェックされているとは思えません。
URLが静的リンクになっていることとヘッダのLast-Modifiedが常に最新では無くコンテンツ作成時期と思われる日付固定になっている程度で対策できると思います。

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

  • 高額ポイントの質問は難しいですね。 http://q.hatena.ne.jp/1333873925 検索などで自動生成可能なコンテンツ で 自動生成・加工したコンテンツ が を検索エンジンで使える形だとすると、 検索結
「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません