1362023489 正規分布を2つ折にした確率分布に対して、「約99%この範囲内におさまる」という範囲を、限られたサンプルから計算して求める方法を教えてください。


参考事例
10、9、10、8、9、10、6、10、10、9

・結果は0~10の整数値
・値の上限は10で10付近の値がよく出る
・試行回数10
・必要な値は1

上記の例から、「99%が1以上」という計算結果は導けますでしょうか?

回答の条件
  • 1人5回まで
  • 13歳以上
  • 登録:2013/02/28 12:51:29
  • 終了:2013/03/04 00:23:28

ベストアンサー

id:a-kuma3 No.2

a-kuma3回答回数4524ベストアンサー獲得回数18802013/02/28 19:20:41

ポイント1000pt

質問を敢えて二つにした、と思うので、もうひとつの質問のことは考えずに書きます。

標本が片側の正規分布に従う、と仮定できるのであれば、標準正規分布表を使って求めます。
あちこちに落ちていると思いますが、ぐぐって最初に見つけたこれを例にとります。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

質問の図にある領域が 99% になるということは、この表から 0.495 を探します。
.4949 ― 2.57
.4951 ― 2.58
なので、間を取って Z = 2.575 としましょう。

これは、標準正規分布での値なので、実際の値は μ±2.575×σ となります。


問題となるのが、標本が正規分布に従っているのかどうか、ということです。
標本数が少ないのは気になりますが、定石としては適合度検定です。

#ちょっと、端折ります

帰無仮説を、「標本値正規分布に従う」とし、有意水準αを1% とする。

まず、標本の基本的な統計値。

平均9.1
分散1.49
標準偏差1.22066


次に、検定統計量を求めます。

5678910標本値
010135度数
-3.358850874-2.539618954-1.720387033-0.901155113-0.0819231920.737308728正規化した値
0.49960.49450.45730.31590.03190.2704確率(正規分布表から)
0.00040.00510.03720.14140.2840.3023ランクに入る確率
0.0040.0510.3721.4142.843.023正規表現に従うとした場合の期待値
0.00417.658843140.3720.1212135790.0090140851.292930533検定統計量


検定統計量の合計は 19.458 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で棄却され、「標本データは、正規分布に従わないとは言えない」となります。

よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。

もってまわった言い方のように聞こえますが、統計検定というのはこういうものです。


適合度検定については、統計の本を読むか、概略でよければ以下のようなところをご覧ください。

あくまでも独立事象として考えてますから、それ以外の要因が値に及ぼす可能性(測定者の習熟度など)を考慮しないと、安全云々の話はできないです。




質問内容が、微妙に変わっていたので、追記です。

μ±2.575×σ = 9.1 - 2.575 × 1.22066 = 5.957

「標本値が正規分布に従わない」とは言えないので、上記の式より、5.957 以下の値がサンプリングされるのは、1%の確率らしい、と言えそうです。


# 以下、統計検定とは関係ない感想です。

にしても、標本数が少ないです(分かってて質問してるのは理解できます)。
もし、製造工程の品質や、自動製造装置の精度のようなものに対してやっているのであれば、正規分布と想定するよりはポアソン分布に従う、と仮定をおいた方が良いような気もします。




更に追記です。
適合度検定の対象を、以下のような確率関数だと想定した場合です。

  • 正規分布の片側に相当する
  • 平均は10、分散は標本値から求める

5678910標本値
010135度数
-4.096159603-3.276927682-2.457695762-1.638463841-0.8192319210正規化した値
0.499980.49950.49310.44950.29390確率(正規分布表から)
1.5E-050.000480.00640.04360.15560.2939ランクに入る確率
0.000150.00480.0640.4361.5562.939正規表現に従うとした場合の期待値
0.00015206.33813330.0640.7295779821.3400616971.445294658検定統計量


検定統計量の合計は 209.9172177
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。


標本から求められた、平均 9.1、標準偏差 1.22 に対して、平均を 10.0 の分布だと仮定してますが、ほぼ μ+σなところです。
μ+σの位置は、正規分布では 84% : 16% の位置になります。
適合しなくて、当然です。

他5件のコメントを見る
id:a-kuma3

平均が10の正規分布との適合度検定した結果を、回答に追記しました。

2013/03/01 08:53:48
id:sample2

ありがとうございました。

2013/03/04 00:35:27

その他の回答(1件)

id:oil999 No.1

oil999回答回数1728ベストアンサー獲得回数3202013/02/28 18:30:54

ポイント250pt

半分に折らない状態での標準正規分布の99.5%点を求めればよいわけで、
2.575829 となります。
つまり -2.575829から0の間に99%の確率分布があることになります。

ご質問の標本が標準正規分布にしたがっているとすると、7以上10以下が99%点になりますから、「99%が1以上」という結論にはなりません。
また、10回試行で6が出ていることは確率を逸脱していますから、その標本は標準正規分布にしたがっている可能性は低いです。

標準正規分布表

http://staff.aist.go.jp/t.ihara/normsdist.html

id:sample2

99.5%の範囲が1~19で、0と20が0.5%となる正規分布を考えたときに、
10回試行で6が出るのは確率を逸脱している、ということでしょうか?

2013/02/28 19:00:41
id:sample2

質問文を編集しました。詳細はこちら

id:a-kuma3 No.2

a-kuma3回答回数4524ベストアンサー獲得回数18802013/02/28 19:20:41ここでベストアンサー

ポイント1000pt

質問を敢えて二つにした、と思うので、もうひとつの質問のことは考えずに書きます。

標本が片側の正規分布に従う、と仮定できるのであれば、標準正規分布表を使って求めます。
あちこちに落ちていると思いますが、ぐぐって最初に見つけたこれを例にとります。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

質問の図にある領域が 99% になるということは、この表から 0.495 を探します。
.4949 ― 2.57
.4951 ― 2.58
なので、間を取って Z = 2.575 としましょう。

これは、標準正規分布での値なので、実際の値は μ±2.575×σ となります。


問題となるのが、標本が正規分布に従っているのかどうか、ということです。
標本数が少ないのは気になりますが、定石としては適合度検定です。

#ちょっと、端折ります

帰無仮説を、「標本値正規分布に従う」とし、有意水準αを1% とする。

まず、標本の基本的な統計値。

平均9.1
分散1.49
標準偏差1.22066


次に、検定統計量を求めます。

5678910標本値
010135度数
-3.358850874-2.539618954-1.720387033-0.901155113-0.0819231920.737308728正規化した値
0.49960.49450.45730.31590.03190.2704確率(正規分布表から)
0.00040.00510.03720.14140.2840.3023ランクに入る確率
0.0040.0510.3721.4142.843.023正規表現に従うとした場合の期待値
0.00417.658843140.3720.1212135790.0090140851.292930533検定統計量


検定統計量の合計は 19.458 。
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で棄却され、「標本データは、正規分布に従わないとは言えない」となります。

よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。

もってまわった言い方のように聞こえますが、統計検定というのはこういうものです。


適合度検定については、統計の本を読むか、概略でよければ以下のようなところをご覧ください。

あくまでも独立事象として考えてますから、それ以外の要因が値に及ぼす可能性(測定者の習熟度など)を考慮しないと、安全云々の話はできないです。




質問内容が、微妙に変わっていたので、追記です。

μ±2.575×σ = 9.1 - 2.575 × 1.22066 = 5.957

「標本値が正規分布に従わない」とは言えないので、上記の式より、5.957 以下の値がサンプリングされるのは、1%の確率らしい、と言えそうです。


# 以下、統計検定とは関係ない感想です。

にしても、標本数が少ないです(分かってて質問してるのは理解できます)。
もし、製造工程の品質や、自動製造装置の精度のようなものに対してやっているのであれば、正規分布と想定するよりはポアソン分布に従う、と仮定をおいた方が良いような気もします。




更に追記です。
適合度検定の対象を、以下のような確率関数だと想定した場合です。

  • 正規分布の片側に相当する
  • 平均は10、分散は標本値から求める

5678910標本値
010135度数
-4.096159603-3.276927682-2.457695762-1.638463841-0.8192319210正規化した値
0.499980.49950.49310.44950.29390確率(正規分布表から)
1.5E-050.000480.00640.04360.15560.2939ランクに入る確率
0.000150.00480.0640.4361.5562.939正規表現に従うとした場合の期待値
0.00015206.33813330.0640.7295779821.3400616971.445294658検定統計量


検定統計量の合計は 209.9172177
検定統計量は、自由度 5 のχ2分布 に従う。
有意水準αを 1% としたときの検定統計量は、χ2分布表 から 16.81。
よって、対立仮説は有意水準 1% で採択され、「標本データは、正規分布に従わないと言える」となります。


標本から求められた、平均 9.1、標準偏差 1.22 に対して、平均を 10.0 の分布だと仮定してますが、ほぼ μ+σなところです。
μ+σの位置は、正規分布では 84% : 16% の位置になります。
適合しなくて、当然です。

他5件のコメントを見る
id:a-kuma3

平均が10の正規分布との適合度検定した結果を、回答に追記しました。

2013/03/01 08:53:48
id:sample2

ありがとうございました。

2013/03/04 00:35:27
  • id:karuishi
    >正規分布を2つ折にした確率分布

    >10、9、10、8、9、10、6、10、10、9
    こちらの値が8だった場合、区間(7,8]を代表しているという解釈で良いのでしょうか?
  • id:sample2
    端数切捨てです。1という水準に達しなければ0という結果が出てくる、と解釈してください。それ以上、具体的な説明はできません。
  • id:takejin
    数値と物理的事象は線形な関係ですか?
    切り捨てで10段階の離散値にしてるんだから、要因がわかってそうだけど。
    統計と言う操作は、リスクが大きいと思うんだけど、いかがだろうか。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません