人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

入門統計学を独学しています。
カイ2乗分布について教えてください。

(1)カイ2乗分布の自由度mは標本サイズnに等しいと云いながら、統計数値表で使う自由度は何故(nー1)になるのか?
(2)信頼係数95%で、統計数値表を使って母標準偏差σの両側有意水準を推定して行くとき、何故、上方有意水準が0.025、下方有意水準が0.975(足すと1)で調べるのか?


●質問者: gonsuke-gongon
●カテゴリ:学習・教育 科学・統計資料
✍キーワード:サイズ 上方 分布 標準偏差 統計
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● ita
●60ポイント

http://www2.kke.co.jp/minitab/nl/MT200610.html

自由度mのカイ2乗分布は「m個の正規分布変数の二乗の和」の分布です。

(データ?本当の平均)は正規分布するので (データ?本当の平均)の二乗の和 …A は自由度nのカイ2乗分布になります。

しかし統計の「標本」分散は(データ?データの平均)の二乗の和…B に比例します。これだと、たとえばデータ全部が+1.0だけ誤差が出ても、データの平均も一緒にずれるので2乗和は変化しません。この自由度が一つ死ぬので n-1の自由度になります。

たとえばデータが二個しかないと(二つのデータの差)の二乗となり、これはn-1=1,一つの正規分布変数の二乗の分布になります。

(2) 検定では、ある分散をもった分布を仮定し、手元にあるデータの分散が出てくる確率を計算します。±10くらいでばらついている分布を仮定すると、±1000くらいばらついたデータも出てくる可能性があるけど、確率はほとんど0になります。また±1くらいしかばらついてないデータも可能性はあるけど、やっぱり確率はほぼ0です。

以下具体的な数字はてきとうです。

分布表の0.025の値は、上の例で言うと元のばらつきが±10でも、データのばらつきが±7とかそれより小さくなる確率が、まあそれなりにあって2.5%くらいになる、という感じです。

0.975のところの値は、データのばらつきが±13以下になる確率が97.5% ということで、逆に言うとそれ以上のばらつきになる確率が2.5%くらいだということです。

ということでデータのバラツキが±10なら、本当のバラツキはまあ95%くらいの確かさで±7から±13の間にあるだろう、ということになります。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ