入門統計学を独学しています。

カイ2乗分布について教えてください。

(1)カイ2乗分布の自由度mは標本サイズnに等しいと云いながら、統計数値表で使う自由度は何故(nー1)になるのか?
(2)信頼係数95%で、統計数値表を使って母標準偏差σの両側有意水準を推定して行くとき、何故、上方有意水準が0.025、下方有意水準が0.975(足すと1)で調べるのか?

回答の条件
  • URL必須
  • 1人1回まで
  • 登録:2007/11/16 13:09:52
  • 終了:2007/11/23 13:10:03

回答(1件)

id:ita No.1

ita回答回数203ベストアンサー獲得回数472007/11/16 18:53:14

ポイント60pt

http://www2.kke.co.jp/minitab/nl/MT200610.html

自由度mのカイ2乗分布は「m個の正規分布変数の二乗の和」の分布です。

(データ-本当の平均)は正規分布するので (データ-本当の平均)の二乗の和 …A は自由度nのカイ2乗分布になります。

しかし統計の「標本」分散は(データ-データの平均)の二乗の和…B に比例します。これだと、たとえばデータ全部が+1.0だけ誤差が出ても、データの平均も一緒にずれるので2乗和は変化しません。この自由度が一つ死ぬので n-1の自由度になります。

たとえばデータが二個しかないと(二つのデータの差)の二乗となり、これはn-1=1,一つの正規分布変数の二乗の分布になります。

(2) 検定では、ある分散をもった分布を仮定し、手元にあるデータの分散が出てくる確率を計算します。±10くらいでばらついている分布を仮定すると、±1000くらいばらついたデータも出てくる可能性があるけど、確率はほとんど0になります。また±1くらいしかばらついてないデータも可能性はあるけど、やっぱり確率はほぼ0です。

以下具体的な数字はてきとうです。

分布表の0.025の値は、上の例で言うと元のばらつきが±10でも、データのばらつきが±7とかそれより小さくなる確率が、まあそれなりにあって2.5%くらいになる、という感じです。

0.975のところの値は、データのばらつきが±13以下になる確率が97.5% ということで、逆に言うとそれ以上のばらつきになる確率が2.5%くらいだということです。

ということでデータのバラツキが±10なら、本当のバラツキはまあ95%くらいの確かさで±7から±13の間にあるだろう、ということになります。

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません