カイ二乗と自由度によって求めるF検定についてわかりやすく教えてください。「分散の比較」といっても、実際にどういう比較がなされているのか、そしてFの値がその比較をどのように表しているのか（どのようにFの値を解釈するのか）がよくわかりません。

F検定は二つのデータの「標準偏差」（あるいは分散）が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう

サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。

ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか（たとえば喫煙者と非喫煙者１００人を調べて平均寿命が違ってたら、実際に寿命が違うのか）。あるいはたまたま平均値がばらついていただけでしょうか。

検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは０.1％の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。

F検定の場合は２つのサンプルの分散の比を計算します。分散が同じならだいたい１の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが１から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。

ita · Accepted Answer · 2012-03-07T23:07:43+09:00

F検定は二つのデータの「標準偏差」（あるいは分散）が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう

サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。

ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか（たとえば喫煙者と非喫煙者１００人を調べて平均寿命が違ってたら、実際に寿命が違うのか）。あるいはたまたま平均値がばらついていただけでしょうか。

検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは０.1％の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。

F検定の場合は２つのサンプルの分散の比を計算します。分散が同じならだいたい１の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが１から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。

ベストアンサー

ita204482012/03/07 23:07:43

その他の回答（2件）

ita204482012/03/07 23:07:43ここでベストアンサー

トライ4312012/03/12 19:41:43

ksmrnp6312012/03/12 21:54:45

コメント（2件)

この質問への反応（ブックマークコメント）