本を読んでいて、「この統計結果は指数分布で、こちらの統計結果はワイブル分布である。」というような文章とそのグラフがでてきたのですが、そもそも指数分布やワイブル分布が何を表しているのかがわからないので、非常に困っています。なにとぞ、よろしくお願いいたします。
結論から先に言いますと、
使い続けているうちに壊れやすくなるもの、言い換えれば寿命があるものは、ワイブル分布に従います。
そうでないもの、(定期的にメンテナンスをするなどして)運が良ければ半永久的に使えるものは、指数分布に従います。
分布の曲線を見ないことには感覚的に理解できないと思いますので、まずこちらをご覧ください。
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/exponential.html
赤線でも青線でもいいですが、これが指数分布の形です。
最初が一番大きくて、なめらかに減っていっていきます。
たとえばこれが、ある機械を使い始めて何日後に故障するかという確率を表したものだとします。
横軸が日にち、縦軸が確率です。
そうすると一番確率が高いのは、使い始めた直後ということになります。
これは一見おかしな気がしますが、もし故障がランダムに起こるようなものであれば、
確率はこのようになるのです。
なぜなら、例えば「2日後に故障する」ためには「1日目に故障せず、2日目に故障する」必要があり、
「3日後に故障する」ためには「1日目、2日目には故障せず、3日目に故障する」といったように、
後に行くに従いどんどんと条件が厳しくなっていくからです。
ちなみに具体例として、「次にいつ飛行機事故が起きるか」というのがあるそうです。
一番起きる確率が高いのは、今日(今日が終わりつつあれば明日)です。
飛行機は飛ぶ前にメンテナンスをするので、事故はほとんど偶然的に発生するからです。
次にこちらを見てください。
http://k-dai.hp.infoseek.co.jp/dai_01_bu/yougo-W.htm
これの上部真ん中のグラフが、ワイブル分布のグラフです。
一般にワイブル分布はαが1よりも大きいものを使うので、
このグラフの中でαが2、3のものを見てください。山の形になっています。
これも、ある機械を使い始めて何日後に故障するかという確率を表したものだとします。
その場合αというのは、使い続けることによる、故障率の上がり具合です。
例えば電球なんかは寿命がありますから、使ってるうちにどんどん故障率は上がっていきますよね。
ですから、この図のように、山の頂点、つまり故障する日のピーク(=平均寿命)が存在するわけです。
(ちなみにαが1の場合は故障率が変化しない時で、指数分布と全く同じになり、
αが1より小さい場合はあまりないので省略します)
もしわからないことがあったらコメントをお願いします。
私も専門ではないので、感覚的な理解しかありませんが。
機械の故障率などから、その機械の平均寿命を出すときなどに良く使っているようですので、例としては機械の故障を例えに使います。
指数分布に従うというときは、部品の劣化や磨耗がない機械の場合に使いますので、故障率が一定となります。つまり、最初の1年で故障する確立と2年目の1年間で故障する確立、10年後の1年間で故障する確立、これ等が全て同じという事です。
(新品を買っても中古品を買っても、故障する確立が変わらない機械の場合が当てはまります。)
ワイブル分布に従うというときは、部品の劣化や磨耗がある機械の場合に使いますので、年々故障率が上がっていきます。つまり、最初の一年目で故障する確立と次の一年で故障する確立を比べると2年目の一年間で故障する確立の方が高くなり、10年後の1年間で故障する確立はもっと高くなります。
(中古品を買うと、新品より故障する確率の高い機会の場合が当てはまります。)
上記のような状態の機械を1000台販売して、毎年の故障した台数を10年間統計した場合、「この統計結果は指数分布で、こちらの統計結果はワイブル分布である。」というような文章になります。
私自身の理解がこの程度なので、かなりアバウトな説明ですが、なんとなくぐらいは伝わりましたでしょうか?
伝わらなかったら、ごめんなさい。
ご丁寧な回答ありがとうございました!
結論から先に言いますと、
使い続けているうちに壊れやすくなるもの、言い換えれば寿命があるものは、ワイブル分布に従います。
そうでないもの、(定期的にメンテナンスをするなどして)運が良ければ半永久的に使えるものは、指数分布に従います。
分布の曲線を見ないことには感覚的に理解できないと思いますので、まずこちらをご覧ください。
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/exponential.html
赤線でも青線でもいいですが、これが指数分布の形です。
最初が一番大きくて、なめらかに減っていっていきます。
たとえばこれが、ある機械を使い始めて何日後に故障するかという確率を表したものだとします。
横軸が日にち、縦軸が確率です。
そうすると一番確率が高いのは、使い始めた直後ということになります。
これは一見おかしな気がしますが、もし故障がランダムに起こるようなものであれば、
確率はこのようになるのです。
なぜなら、例えば「2日後に故障する」ためには「1日目に故障せず、2日目に故障する」必要があり、
「3日後に故障する」ためには「1日目、2日目には故障せず、3日目に故障する」といったように、
後に行くに従いどんどんと条件が厳しくなっていくからです。
ちなみに具体例として、「次にいつ飛行機事故が起きるか」というのがあるそうです。
一番起きる確率が高いのは、今日(今日が終わりつつあれば明日)です。
飛行機は飛ぶ前にメンテナンスをするので、事故はほとんど偶然的に発生するからです。
次にこちらを見てください。
http://k-dai.hp.infoseek.co.jp/dai_01_bu/yougo-W.htm
これの上部真ん中のグラフが、ワイブル分布のグラフです。
一般にワイブル分布はαが1よりも大きいものを使うので、
このグラフの中でαが2、3のものを見てください。山の形になっています。
これも、ある機械を使い始めて何日後に故障するかという確率を表したものだとします。
その場合αというのは、使い続けることによる、故障率の上がり具合です。
例えば電球なんかは寿命がありますから、使ってるうちにどんどん故障率は上がっていきますよね。
ですから、この図のように、山の頂点、つまり故障する日のピーク(=平均寿命)が存在するわけです。
(ちなみにαが1の場合は故障率が変化しない時で、指数分布と全く同じになり、
αが1より小さい場合はあまりないので省略します)
もしわからないことがあったらコメントをお願いします。
まだまだ勉強しなければならないと思いますが、おかげさまで、なんとか大学のゼミを無事切り抜けることができそうです。
ありがとうございました!
まだまだ勉強しなければならないと思いますが、おかげさまで、なんとか大学のゼミを無事切り抜けることができそうです。
ありがとうございました!