2年前から動いていたシステムで3ヶ月前から急にトラブルが出ています。
対処療法的な対策をしたのですが、このトラブルに対して有効だったかどうかを検定したいのです。
検定に使う具体的な手法を教えてください(もし参考ページがあれば、そちらも)。もちろん具体的な検定プロセスがあれば、一番嬉しいですね。
色々な検定方法があって、どれがぴったり来るのかうまく分かりませんでした。
●トラブル発生日のデータ
3/30, 3/30, 4/2, 4/2, 5/3, 5/4, 5/4, 5/13, 5/18, 6/9, 6/11, 6/12
●6/15に対策実施。以降6/28までトラブルなし。
http://www.google.co.jp/search?num=50&hl=en&safe=off&...
「有意な差があるかどうかの検定」という発想で検討されたらよいのではないかと思います。
対策前は 120日中 12回つまり 0.1回/日で発生しています。
対策後は 15日中 0回発生しています。
もともとの発生率が 0.1回/日 と推測できますので,15日やって 0回発生したというのが「0.1回/日より発生率が下がったと見なして良いか」という検定を行うことになります。
0.1の確率で当たるクジを15回引いて,0回しか当たらないのは普通か? という検定です。
ここで,信頼区間というパラメータが必要です。通常は 95%という数字を使います。この検定の結論が正しい可能性は 95% という意味です。(100%にしたければ未来永劫データをとり続けてから結論が初めて出ることになります)
具体的には,カイ二乗検定で自由度1,p=0.05として分布表を眺めてみると 3.8 とあります。つまり,カイ二乗値が3.8以上にならないと有意差があったとみなされません。現時点では 1.5 なので,「有意差はない」ということになります。
先のたとえで言うと「15回なら,一度もクジの当たらなくても別におかしくない」ということになります。
今回の場合には,(0-0.1×x)^2 /(0.1×x)=3.8 となるのは x=38 なので,38日間発生しなければ「対策効果あり」としてよいのではないでしょうか?
早めに「効果あり」といいたいのであれば,信頼区間を90%にします。社会科学では90%を使うので,それほどは問題ありません。この場合には 2.7 なので 27日間発生しなければ「対策効果あり」としてよいと思います。
回答ありがとうございます。
実際の数値での丁寧な解説、お世話になりました。
ばらつきが大きいのと個数が少ないので、単純に
検定で有意差検定すればいいのかどうかが不安でした。
下記の表2で「適合度-ノンパラメトリック(名義尺度)」の部分で良かったということですね。
http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/nonpara.html
質問は、まだオープンにしておこうと思います。