統計学についての質問です｡ｿﾌﾄｳｪｱにある条件で1000回実行すると1回程度の割合で発生するﾊﾞｸﾞがあったとします｡例えば並行処理のようなﾀｲﾐﾝｸﾞ依存のﾊﾞｸﾞです｡ …

統計学についての質問です｡ｿﾌﾄｳｪｱにある条件で1000回実行すると1回程度の割合で発生するﾊﾞｸﾞがあったとします｡例えば並行処理のようなﾀｲﾐﾝｸﾞ依存のﾊﾞｸﾞです｡

これを修正したので確かに治ったということを確かめたい｡そのとき同じ条件で何回実行してもﾊﾞｸﾞが再現しなければ｢ﾊﾞｸﾞが治った｣という確信(統計的根拠)を持てるといえるでしょうか？

私が考えたのはﾊﾞｸﾞの有り無しについてｶｲ自乗検定を行うこととして､有意なp値がでる回数まで実行する､というものです｡

しかし次のような疑念が生じました｡

(1) 検定ではｻﾝﾌﾟﾙ数を増やせば有意差は出やすくなる｡有意なp値になるまでやるというのはいわゆる｢p値ﾊｯｷﾝｸﾞ｣であり妥当な実験といえなくなるのではないか？

(2) 検定においては帰無仮説｢ﾊﾞｸﾞの発生頻度は同じ確率分布である｣が棄却されるにすぎず､｢発生頻度が下がった｣とは言えても｢ﾊﾞｸﾞが治った(0回になった)｣とは言えないのではないか？

｢統計学ではこう考える｣｢異なる検定を使用すべき｣｢検定ではない方法を使え｣｢ISOxxxxxではこう定義されている｣｢科学哲学ではこう考える｣などあらゆる観点からの意見を歓迎します｡

＞｢ﾊﾞｸﾞが治った(0回になった)｣とは言えない
統計学的手段に頼るのであれば､どんな検証をしても｢ﾊﾞｸﾞが治った(0回になった)｣という結論を出すことは不可能では？？
ﾊﾞｸﾞ発生率0％というためには､ﾊﾞｸﾞの発生原因を確定して､ﾌｨｯｸｽして､数学的手段で証明するしかないのでは｡
それが不可能であれば､｢十分な回数｣の検証をしてﾊﾞｸﾞ発生率が｢十分に低い｣ことを示すのが次善の策ではないでしょうか｡
つまり､十分な回数がどれくらいで､十分に低いとはどれくらいなのかを考えるのが次にすべきことのような｡