コントロール変数
回帰分析等において、独立変数の影響度合いを一定にするために使用される。
たとえば、特定の産業からの影響を抑えたい時には、産業がコントロール変数となる。
(統制変数と同義)
http://www.jil.go.jp/institute/project/h15-18/05/prs5_04.pdf
(読みにくい場合は拡大して下さい)
説明変数、従属変数という用語と
「①コントロール変数」、「②モデレータ変数」という用語の位置づけが違います。
回帰分析は、ある変数の値(従属変数とか目的変数と言われます)を、その他の変数(説明変数)によって予測(計算)する式を導きます。
説明変数と従属変数にはその親子関係を示している意味しかありません。
しかし、コントロール変数、モデレータ変数は、従属変数の性質を示します。
と書いて、いろいろ調べてみましたが、コントロール変数の良い定義は見つけることは出来ませんでした。
英語ではcontrol variablesで、調整変数とも訳されると思いますが、従属変数に影響を与える変数という意味で、
捉え方の角度は違いますが、恐らく説明変数とほぼ同義だと思います。
下記のリンクの通りモデレータ変数は二つの変数(回帰分析の場合には、説明変数の一つと目的変数)の両方に影響を及ぼす別の説明変数という理解で良いと思います。日本語では交絡因子という言い方の方があっているような気がします。
勉強しながらの回答です。間違いがあれば指摘して下さい。
モデレータ変数に関しては下記リンクのように明確な定義を見つけました。
moderator変数とmediator変数は意味が違うことも指摘していて興味深かったです。
違いは、http://psych.wisc.edu/henriques/mediator.htmlここの解説が分かりやすいです。
http://www.unc.edu/courses/2008spring/psyc/270/001/chap7.html
抜粋
Mediating Variables andInfluence Diagrams
Two ways in which a third variable might mediate an observed correlation
Z influences both X and Y
X influences Z which influences Y
Moderator Variables
A moderator variable is a variable that moderates the relationship between other variables
I.e., the relationship between X and Y depends on the level of some third variable, Z
Example: Region of the country (Z) may moderate the relationship between incarceration (X) and crime rates (Y)
This is an example of an interaction. We look at interactions in depth in Chapter 12
Mediator versus Moderator
The partial correlation between two variables may be smaller then the simple correlation when a mediating variable is introduced
The mediator accounts for, or mediates, the correlation
A simple correlation between two variables may change when the level of a moderator variable changes
The moderator interacts with the other variables, or moderates the correlation
Moderator Variables: An Example
A method used to investigate heritability of traits involves correlating the test scores (personality, intelligence, etc) of identical twins
The higher the correlation, the greater the effect of heredity
What is the effect of the age of the twins? (Age is the moderator variable)
早々のご回答、誠にありがとうございました。
MEI-ZA-YUさんの回答は参考になりました。
独立変数というのは、説明変数のうち最も重要な変数、最も調べたい変数で、
それ以外の説明変数のことをコントロール変数と呼ぶと考えて良いと思います。
コメント欄がオープンされていなかったのでここに追加しました。
親切なご回答誠にありがとうございました。
MEI-ZA-YUさんへのコメントは、下記の通りです。
「もう少し教えていただきたいのですが、単回帰においては、
y=ax+bとなり、aが独立変数、yが従属変数となると思います。コントロール変数は、どこに
、どのように挿入されるものなのでしょうか?例などをあげながら、ご教授いただけますと
大変助かります」ということでした。
もし、分かりやすい説明がございましたら、よろしくお願いいたします。
>「もう少し教えていただきたいのですが、単回帰においては、
>y=ax+bとなり、aが独立変数、yが従属変数となると思います。コントロール変数は、どこに
>、どのように挿入されるものなのでしょうか?例などをあげながら、ご教授いただけますと
>大変助かります」
y=ax+bは、正確には直線単回帰ですね(xが説明変数、yが従属変数、aが変数xの係数)。
コントロール変数が入るということは単回帰ではなくなります。つまり重回帰(多変量回帰分析)になります。
式としては、y=a_1x_1+a_2x_2+a_3x_3+b等のようになります。
そしてx_1が独立変数とすると、x_2,x_3がコントロール変数になります。
この場合、x_2がyにもx_1にも関連するならばモデレータ変数と言えるでしょう。
またx_1がyと関連が強いとき、例えばx_1(1日の塩分摂取量)、x_2(血圧)、y(死亡年齢)とすると、
塩分摂取量が多い人は血圧が高い。血圧が高い人は心疾患の危険性が高く平均より若く死亡する。ということが起こります。
このときx_2を考えないと塩分摂取量が多いと早死にするということになります。ここでx_2はこの二つの変数の間に存在するのでmediator変数と言えるでしょう。
早々のご回答ありがとうございました。もう少し教えていただきたいのですが、単回帰においては、
y=ax+bとなり、aが独立変数、yが従属変数となると思います。コントロール変数は、どこに
、どのように挿入されるものなのでしょうか?例などをあげながら、ご教授いただけますと
大変助かります。よろしくお願いいたします。