カイ二乗と自由度によって求めるF検定についてわかりやすく教えてください。「分散の比較」といっても、実際にどういう比較がなされているのか、そしてFの値がその比較をどのように表しているのか(どのようにFの値を解釈するのか)がよくわかりません。


この手の話に疎いので、平易な言葉で噛み砕いて説明していただけると助かります。

回答の条件
  • 1人2回まで
  • 登録:
  • 終了:2012/03/12 23:46:33
※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ベストアンサー

id:ita No.1

回答回数204ベストアンサー獲得回数48

ポイント68pt

F検定は二つのデータの「標準偏差」(あるいは分散)が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう

サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。

ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか(たとえば喫煙者と非喫煙者100人を調べて平均寿命が違ってたら、実際に寿命が違うのか)。あるいはたまたま平均値がばらついていただけでしょうか。

検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは0.1%の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。

F検定の場合は2つのサンプルの分散の比を計算します。分散が同じならだいたい1の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが1から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。

その他の回答2件)

id:ita No.1

回答回数204ベストアンサー獲得回数48ここでベストアンサー

ポイント68pt

F検定は二つのデータの「標準偏差」(あるいは分散)が同じかどうか判定する方法ですが、
この手の話に疎いということですのでもっと単純な、平均が同じかどうかの検定で説明しましょう

サンプル数が非常にいっぱいあればサンプルの平均値は真実の値にとても近くなりますが、
そうでなければ平均値は真の値からずれて、調査によって真の値の回りにばらつきます。

ふたつの調査で平均値を計算し、それが違っていた場合、それは真の平均値が違っていたのでしょうか(たとえば喫煙者と非喫煙者100人を調べて平均寿命が違ってたら、実際に寿命が違うのか)。あるいはたまたま平均値がばらついていただけでしょうか。

検定を行う場合、平均値が同じだとまずは仮定し、実際でてきたような平均値の差が「たまたま」ばらつきで出てくるようなことはどんくらい起こりえるのか、ということを計算します。
これが「こんなに平均値が違うほどばらつくことは0.1%の確率でしかおこりえない」という結果になれば「たまたまじゃなくて実際に平均値が違う」と結論できます。
そうじゃない場合は「この程度の平均値の違いはたまたま出ることもあるからもっとサンプル数が必要」ということになります。

F検定の場合は2つのサンプルの分散の比を計算します。分散が同じならだいたい1の周りでばらつきます。
http://cse.niaes.affrc.go.jp/minaka/R/R-F.html
二つのサンプルの数が増えるほど分布は狭くなります。
これが1から大きくずれてて、分布の端よりもっと離れていたら分散が実際違うと結論できます。

id:ksmrnp No.3

回答回数63ベストアンサー獲得回数1

ポイント66pt

http://elsur.jpn.org/resource/anova.pdf
を参考にしてください

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

回答リクエストを送信したユーザーはいません