参考事例(試行回数10、1超でOK)
10、9、10、8、9、10、6、10、10、9
・物理的に10が上限値
・とりうる値は0~10の整数値
たった10サンプルの中に6という結果が紛れ込んでいるため、「不良率が高いのでは?」という意見が出て、「スジが悪い」と開発終了の瀬戸際なのです。
求められている不良率は1%未満なので、上記の結果から「0か1が出る確率は1%未満」といいたいのです。確率分布が不明なので、正確な結果は出ません。しかし、一般的な仮定の下で「不良率1%未満」となれば万々歳です。
もちろん、常識的な仮定で計算した結果、不良率が1%以上になってしまうなら、残念ですが諦めがつきます。
これは理論的に上限が決まっている試験なので、飛びぬけて高い値は絶対に出てきません。そして大半の試験結果が、上限付近となる特長があります。また低い値が出る原因は多々あって、それらを完全に制御することはできないという前提があります。
提出されている数値は、ある製品の品質を表す数値(成績)だと仮定します。
満点が10点。
それなりの品質で作られているため、平均は良い方に偏っており、悪い点数はあまり観測されない。
# この辺りの仮定が違ってると、これ以降の意味が無くなっちゃうわけですが...
そこで、点数ではなく、満点からの減点に着目し、減点の出現頻度がポアソン分布に従う、と仮定する。
つまり、10 → 0、9 → 1 というふうに加工するということです。
度数分布は、以下のようになります。
得点 | 減点 | 測定回数 |
---|---|---|
10 | 0 | 5 |
9 | 1 | 3 |
8 | 2 | 1 |
7 | 3 | 0 |
6 | 4 | 1 |
5 | 5 | 0 |
この減点の分布が、ポアソン分布に従うかどうかを、適合度検定します。
つまり、帰無仮説は「減点の分布は、ポアソン分布に従っている」です。
対立仮説は「減点の分布は、ポアソン分布ではない」です。
標本数が少ないので、有意水準は 5% としておきます。
0 | 1 | 2 | 3 | 4 | 5 | 減点 |
5 | 3 | 1 | 0 | 1 | 0 | 標本の度数 |
0 | 3 | 2 | 0 | 4 | 0 | 減点×標本の度数(λの推定に使う) |
0.40656966 | 0.36591269 | 0.16466072 | 0.04939821 | 0.0111146 | 0.00200063 | λ=0.9 のポアソン分布の確率 |
4.0656966 | 3.6591269 | 1.6466072 | 0.4939821 | 0.111146 | 0.0200063 | ポアソン分布(λ=0.9)の期待度数 |
λの推定値は 0.9 です(↑の表の三行目の合計を、二行目の合計で割った値)。
ポアソン分布の確率は、こちらの表を使ってます。もちろん、表は累積確率なので、差分に読み替えてます。
んで、期待度数が 1 未満の階級を統合します。つまり、減点が 2~5 の階級をまとめています。
0 | 1 | 2-5 | ランク |
5 | 3 | 2 | 度数 |
4.0656966 | 3.6591269 | 2.2717416 | 期待度数 |
0.214704374 | 0.118730036 | 0.032505236 | 検定統計量 |
検定統計量の合計は 0.365939647 。
検定統計量は、自由度 1 (3-1-1) のχ2分布 に従う。
有意水準αを 5% としたときの検定統計量は、χ2分布表 から 3.84。
よって、対立仮説は有意水準 5% で棄却され、「標本データは、ポアソン分布に従わないとは言えない」となります。
つまり、λ=0.9 のポアソン分布っぽい、ということです。
1% 確率のランクを期待してたんですよね。
ポアソン分布表から、λ=0.9 のところを引用します。
0 | 0.40656966 |
1 | 0.77248235 |
2 | 0.93714307 |
3 | 0.98654128 |
4 | 0.99765588 |
5 | 0.99965651 |
6 | 0.99995660 |
7 | 0.99999518 |
8 | 0.99999952 |
9 | 0.99999996 |
10 | 1.00000000 |
累積確率が 0.99 を超えるのは、3~4 です。
減点が 4 以上の値、つまり点数が 6 以下の点数が出てくるのは 1% 未満ということが言えそうです。
でも、最終的に統計検定に使った表を見れば分かりますが、階級が三つで、それぞれの度数が 5, 3, 2 という表をポアソン分布だと推定しているわけです。
ポアソン分布は、極端な値の発生頻度が低い、離散値で観測される現象でよく使われます。
標本数が少ないので、期待度数が 1 を超えるまで階級を統合しましたが、通常はもっと大きな値で統合します。
つまり、もう少し、標本が欲しいな、というところなんです(仕方ないとは言え)。
後、「リスク」という捕え方をされた場合には、計算上の出現率よりも厳しいところを求められるのが常です。
製品の歩留まりを考えた場合、歩留まり率を 99%(100個に 1個が不良品)に抑えたければ、出現率はもっと低いところを求められます。
開発段階のようなので、この辺りはある程度の値でも良いのかもしれませんが。
後付けになりますが、ポアソン分布の適合度検定については、以下の辺りを参照ください。
>また低い値が出る原因は多々あって、
その原因が無視できるものであるならば、6とか極端なのは無視してもよいと思います。
不良品は検査でわかるということは、しばらくやれば、どれぐらい 不良品が出たかわかるはずです。
そこから 不良率を求めるのが 一般的かと思われますが。
ですから、開発途中で数を作れないので、たった10サンプルから結果を予測しなければならないのです。いま説得できなければ、ここで終わりなんです。
高級品なので、最終的な生産数も数百台程度です。数百台しか生産しないもののために試作品を10台作るだけでもたいへんなのです。1%未満の不良率というのは、実質的に不良が1つも出ないことを期待するということを意味しています。
ああ、そういう意味でしたか。じゃあ、普通に考えて6の確率10%だから、1以下が出る確率はだいだい5%です。なので、安全率は99,5%ですね。
「不良率を予測したい」というのが真意です。サンプルはこれ以上、増やせません。「10サンプルやって、全部OKだった」が私の報告で、それに対して「6~10というと、けっこう値がばらついている。この調子だと、0や1も高い確率で出てしまうのではないか。この製品は筋が悪いから辞めよう」という意見が出ているわけです。私としては「計算上、0や1はこんなに出にくい」と反論したいのです。
どうもありがとうございます。
母集団が正規分布にしたがっていると仮定した場合、6に着目すると、確率0.1で出ているため、確率0.05で1以下が出る可能性があります。
よって、安全率は99.5%となります。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html
問題の製品は、不良が発見されたら全損になります。
もともとサンプルは10しか作れない前提で、試験結果を見て結論を得ることになっており、現状では「こりゃダメだ。リスクが高すぎる」となっているのです。そこで「結論を出すのは明日の夕方まで待ってください」と。
統計に無知な者同士なので、こちらが少しお勉強したら何か反論できるのではないかと思ったのです。しかし無知な状態からWebページをパラ見しても何だかよくわからない。それで人力検索に頼ってみた次第です。
ともあれ、正規分布表を見ると、10個作って全て基準値の何倍といった数字でも、運悪く基準値を下回る確率ってけっこう高いのですね……。
別の質問でも書きましたが、ポアソン分布を想定した方が良いと思います。
明日の夕方までだったら、もうちょっと時間はありますよね。
回答できるところまで行けるかどうか、分からないですけど、ちょっとやってみます。
提出されている数値は、ある製品の品質を表す数値(成績)だと仮定します。
満点が10点。
それなりの品質で作られているため、平均は良い方に偏っており、悪い点数はあまり観測されない。
# この辺りの仮定が違ってると、これ以降の意味が無くなっちゃうわけですが...
そこで、点数ではなく、満点からの減点に着目し、減点の出現頻度がポアソン分布に従う、と仮定する。
つまり、10 → 0、9 → 1 というふうに加工するということです。
度数分布は、以下のようになります。
得点 | 減点 | 測定回数 |
---|---|---|
10 | 0 | 5 |
9 | 1 | 3 |
8 | 2 | 1 |
7 | 3 | 0 |
6 | 4 | 1 |
5 | 5 | 0 |
この減点の分布が、ポアソン分布に従うかどうかを、適合度検定します。
つまり、帰無仮説は「減点の分布は、ポアソン分布に従っている」です。
対立仮説は「減点の分布は、ポアソン分布ではない」です。
標本数が少ないので、有意水準は 5% としておきます。
0 | 1 | 2 | 3 | 4 | 5 | 減点 |
5 | 3 | 1 | 0 | 1 | 0 | 標本の度数 |
0 | 3 | 2 | 0 | 4 | 0 | 減点×標本の度数(λの推定に使う) |
0.40656966 | 0.36591269 | 0.16466072 | 0.04939821 | 0.0111146 | 0.00200063 | λ=0.9 のポアソン分布の確率 |
4.0656966 | 3.6591269 | 1.6466072 | 0.4939821 | 0.111146 | 0.0200063 | ポアソン分布(λ=0.9)の期待度数 |
λの推定値は 0.9 です(↑の表の三行目の合計を、二行目の合計で割った値)。
ポアソン分布の確率は、こちらの表を使ってます。もちろん、表は累積確率なので、差分に読み替えてます。
んで、期待度数が 1 未満の階級を統合します。つまり、減点が 2~5 の階級をまとめています。
0 | 1 | 2-5 | ランク |
5 | 3 | 2 | 度数 |
4.0656966 | 3.6591269 | 2.2717416 | 期待度数 |
0.214704374 | 0.118730036 | 0.032505236 | 検定統計量 |
検定統計量の合計は 0.365939647 。
検定統計量は、自由度 1 (3-1-1) のχ2分布 に従う。
有意水準αを 5% としたときの検定統計量は、χ2分布表 から 3.84。
よって、対立仮説は有意水準 5% で棄却され、「標本データは、ポアソン分布に従わないとは言えない」となります。
つまり、λ=0.9 のポアソン分布っぽい、ということです。
1% 確率のランクを期待してたんですよね。
ポアソン分布表から、λ=0.9 のところを引用します。
0 | 0.40656966 |
1 | 0.77248235 |
2 | 0.93714307 |
3 | 0.98654128 |
4 | 0.99765588 |
5 | 0.99965651 |
6 | 0.99995660 |
7 | 0.99999518 |
8 | 0.99999952 |
9 | 0.99999996 |
10 | 1.00000000 |
累積確率が 0.99 を超えるのは、3~4 です。
減点が 4 以上の値、つまり点数が 6 以下の点数が出てくるのは 1% 未満ということが言えそうです。
でも、最終的に統計検定に使った表を見れば分かりますが、階級が三つで、それぞれの度数が 5, 3, 2 という表をポアソン分布だと推定しているわけです。
ポアソン分布は、極端な値の発生頻度が低い、離散値で観測される現象でよく使われます。
標本数が少ないので、期待度数が 1 を超えるまで階級を統合しましたが、通常はもっと大きな値で統合します。
つまり、もう少し、標本が欲しいな、というところなんです(仕方ないとは言え)。
後、「リスク」という捕え方をされた場合には、計算上の出現率よりも厳しいところを求められるのが常です。
製品の歩留まりを考えた場合、歩留まり率を 99%(100個に 1個が不良品)に抑えたければ、出現率はもっと低いところを求められます。
開発段階のようなので、この辺りはある程度の値でも良いのかもしれませんが。
後付けになりますが、ポアソン分布の適合度検定については、以下の辺りを参照ください。
ポアソン分布は初めて目にします。半日頑張ってみて、当たり前の結論ではありますが、付け焼刃で振り回せるものではなさそうだとは思いました。理解が追いつくまで保留させてください。
ありがとうございました。
たぶん統計的に処理できるほどのサンプル数じゃない。
6って数値と頻度が微妙すぎる。
8と大きく隔たってないし、10%の確率だし。
無視できないと思う。
それぞれの数値に言い訳ができるなら(ということは、同一条件じゃないことでもあり、このサンプルには意味が無い)検討の余地ありだけど。
6が出た時点で、実験?計画の見直しです。
1未満になる技術的要因、を掘り下げた方がいいのでは?
確率などで予測できます?
1と6と10の要因が違うと、複合分布で解析不能です。
気持ち的には、1が不良で最低6なんだから、全然問題ありません、ですけどねぇ。
どうもありがとうございました。
質問文のデータから、
平均=9.1
標準偏差=1.28
が求められます。
まず、0 か 1 が出る確率 について
が成り立ちます。
ここで、チェビシェフの不等式
が成り立つので、 より、
とおくと、
が成り立ちます。
従って、0 か 1 が出る確率は 0.02 以下と考えられます。
ブートストラップで k の 95%信頼区間を求めると (4.13,18.0) となり、
0 か 1 が出る確率は 0.06 以下である可能性が非常に高いです。
x <- c(10,9,10,8,9,10,6,10,10,9) n <- length(x) ks <- replicate(100000, { tmp <- sample(x, size=n, replace=TRUE) (mean(tmp) - 1) / sd(tmp) }) k <- quantile(ks, probs=c(0.025, 0.975)) 1/k^2
どうもありがとうございました。
ポアソン分布は初めて目にします。半日頑張ってみて、当たり前の結論ではありますが、付け焼刃で振り回せるものではなさそうだとは思いました。理解が追いつくまで保留させてください。
2013/03/01 03:39:49ありがとうございました。
2013/03/04 00:36:10