複数の二値説明変数と連続値の目的変数Pを持つデータで、

説明変数が目的変数に与える影響を考えます。

この時、説明変数V1を持つデータのP平均値=F(V1)
つまり、V1によるPの期待値を計算します。

この時、この値の、
データマイニング的な意味は?
この値に名前が付いてるでしょうか?


そして、

VがPに対して正負の影響を与える分岐点は、F(V)の値が何の時でしょうか?
全データPの平均値が、分岐点でよいでしょうか?

回答の条件
  • URL必須
  • 1人5回まで
  • 登録:2014/06/17 21:18:55
  • 終了:2014/06/24 21:20:03

回答(1件)

id:watercooler No.1

井戸端さん回答回数289ベストアンサー獲得回数512014/06/17 22:22:33

ポイント100pt

複数の二値説明変数と連続値の目的変数Pを持つデータ

数量化理論で処理できそうなデータね。

データマイニング的な意味は?

説明変数1つ1つに重みづけをして回帰分析のようなことを行って従属変数Pの値を求める式を作る段階ね。
このあたりの例がわかりやすいかしら?
重回帰分析

VがPに対して正負の影響を与える分岐点は、F(V)の値が何の時でしょうか?
全データPの平均値が、分岐点でよいでしょうか?

説明変数と目的変数Pの関係がリニアであるとは限らないわ。だから平均値が分岐点みたいなことは言えないの。分岐点を探るには数量化II類が使えるわ。
数量化2類PDF

他8件のコメントを見る
id:TAK_TAK

数量化Ⅱ類は適切では無い、
と言う事でしょうか?

2014/06/20 10:11:30
id:watercooler

整理はできたかしら?

あなたの質問は影響がプラスに働くかマイナスに働くかなのだからII類よ。

実数値を知りたいならI類(≒重回帰)になるわ。最初の回答を読み返してね。

2014/06/24 23:13:19

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません