この手の話に疎いので、平易な言葉で噛み砕いて説明していただけると助かります。
F検定は二つのデータの「標準偏差」(あるいは分散)が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう
サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。
ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか(たとえば喫煙者と非喫煙者100人を調べて平均寿命が違ってたら、実際に寿命が違うのか)。あるいはたまたま平均値がばらついていただけでしょうか。
検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは0.1%の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。
F検定の場合は2つのサンプルの分散の比を計算します。分散が同じならだいたい1の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが1から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。
F検定は二つのデータの「標準偏差」(あるいは分散)が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう
サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。
ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか(たとえば喫煙者と非喫煙者100人を調べて平均寿命が違ってたら、実際に寿命が違うのか)。あるいはたまたま平均値がばらついていただけでしょうか。
検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは0.1%の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。
F検定の場合は2つのサンプルの分散の比を計算します。分散が同じならだいたい1の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが1から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。
コメント(2件)