人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

正規分布を2つ折にした確率分布に対して、「約99%この範囲内におさまる」という範囲を、限られたサンプルから計算して求める方法を教えてください。

参考事例
10、9、10、8、9、10、6、10、10、9

・結果は0?10の整数値
・値の上限は10で10付近の値がよく出る
・試行回数10
・必要な値は1

上記の例から、「99%が1以上」という計算結果は導けますでしょうか?

1362023489
●拡大する

●質問者: sample2
●カテゴリ:科学・統計資料
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● oil999
●250ポイント

半分に折らない状態での標準正規分布の99.5%点を求めればよいわけで、
2.575829 となります。
つまり -2.575829から0の間に99%の確率分布があることになります。

ご質問の標本が標準正規分布にしたがっているとすると、7以上10以下が99%点になりますから、「99%が1以上」という結論にはなりません。
また、10回試行で6が出ていることは確率を逸脱していますから、その標本は標準正規分布にしたがっている可能性は低いです。

標準正規分布表

http://staff.aist.go.jp/t.ihara/normsdist.html


sample2さんのコメント
99.5%の範囲が1?19で、0と20が0.5%となる正規分布を考えたときに、 10回試行で6が出るのは確率を逸脱している、ということでしょうか?

2 ● a-kuma3
●1000ポイント ベストアンサー

質問を敢えて二つにした、と思うので、もうひとつの質問のことは考えずに書きます。

標本が片側の正規分布に従う、と仮定できるのであれば、標準正規分布表を使って求めます。
あちこちに落ちていると思いますが、ぐぐって最初に見つけたこれを例にとります。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

質問の図にある領域が 99% になるということは、この表から 0.495 を探します。
.4949 ― 2.57
.4951 ― 2.58
なので、間を取って Z = 2.575 としましょう。

これは、標準正規分布での値なので、実際の値は μ±2.575×σ となります。


問題となるのが、標本が正規分布に従っているのかどうか、ということです。
標本数が少ないのは気になりますが、定石としては適合度検定です。

#ちょっと、端折ります

帰無仮説を、「標本値正規分布に従う」とし、有意水準αを1% とする。

まず、標本の基本的な統計値。

平均9.1
分散1.49
標準偏差1.22066


次に、検定統計量を求めます。

5678910標本値
010135度数
-3.358850874-2.539618954-1.720387033-0.901155113-0.0819231920.737308728正規化した値
0.49960.49450.45730.31590.03190.2704確率(正規分布表から)
0.00040.00510.03720.14140.2840.3023ランクに入る確率
0.0040.0510.3721.4142.843.023正規表現に従うとした場合の期待値
0.00417.658843140.3720.1212135790.0090140851.292930533検定統計量


検定統計量の合計は 19.458 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で棄却され、「標本データは、正規分布に従わないとは言えない」となります。

よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。

もってまわった言い方のように聞こえますが、統計検定というのはこういうものです。


適合度検定については、統計の本を読むか、概略でよければ以下のようなところをご覧ください。

あくまでも独立事象として考えてますから、それ以外の要因が値に及ぼす可能性(測定者の習熟度など)を考慮しないと、安全云々の話はできないです。




質問内容が、微妙に変わっていたので、追記です。

μ±2.575×σ = 9.1 ? 2.575 × 1.22066 = 5.957

「標本値が正規分布に従わない」とは言えないので、上記の式より、5.957 以下の値がサンプリングされるのは、1%の確率らしい、と言えそうです。


# 以下、統計検定とは関係ない感想です。

にしても、標本数が少ないです(分かってて質問してるのは理解できます)。
もし、製造工程の品質や、自動製造装置の精度のようなものに対してやっているのであれば、正規分布と想定するよりはポアソン分布に従う、と仮定をおいた方が良いような気もします。




更に追記です。
適合度検定の対象を、以下のような確率関数だと想定した場合です。

5678910標本値
010135度数
-4.096159603-3.276927682-2.457695762-1.638463841-0.8192319210正規化した値
0.499980.49950.49310.44950.29390確率(正規分布表から)
1.5E-050.000480.00640.04360.15560.2939ランクに入る確率
0.000150.00480.0640.4361.5562.939正規表現に従うとした場合の期待値
0.00015206.33813330.0640.7295779821.3400616971.445294658検定統計量


検定統計量の合計は 209.9172177
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。


標本から求められた、平均 9.1、標準偏差 1.22 に対して、平均を 10.0 の分布だと仮定してますが、ほぼ μ+σなところです。
μ+σの位置は、正規分布では 84% : 16% の位置になります。
適合しなくて、当然です。


a-kuma3さんのコメント
うわっ、質問の内容が微妙に変わってるじゃないですか orz

sample2さんのコメント
どうもありがとうございます。再度、読み直しますね。

a-kuma3さんのコメント
馬鹿です >ぼく 肝心なところを間違えてました。 検定統計量が、χ2分布の値を超えてるんですから、対立仮説を採択です。 つまり、正規分布とはみなせません。

sample2さんのコメント
私なりに計算を追っていったのですが、「片側」の正規分布という当初の条件が、検定の段階から先、どこかへ消えているように思えます。素朴に、平均値が9.1で……と考えるのはヘンだと感じます。

a-kuma3さんのコメント
>> 素朴に、平均値が9.1で……と考えるのはヘンだと感じます。 << 正規分布の片側だけに着目することはあっても、正規分布の片側だけという分布は通常考えられないので、適合度検定では正規分布に対する検定にしてました。 もちろん、特殊な確率分布というのはいろいろありますが、発生するメカニズムが分かってて定式化されているか、十分な観測値があって近似式が求められているか、のどちらかです。 ポアソン分布の方が良かろう、という回答は別の方に書いたので、不自然さには目をつぶって正規分布の片側に相当する確率関数を対象とした適合度検定もやってみます。

a-kuma3さんのコメント
平均が10の正規分布との適合度検定した結果を、回答に追記しました。

sample2さんのコメント
ありがとうございました。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ