--A(A列)--
0.5008
0.5005
0.4989
0.5008
0.4997
0.5012
0.5013
0.5012
0.4991
0.5028
--B(B列)--
0.5051
0.5005
0.5013
0.4984
0.4905
0.5004
0.4908
0.5034
0.4963
0.4988
A、Bと二つの数値データ(実際は1000行以上あります)があります。
Aについては一切、手を加えていない生データです。
Bについては、もしかするとAのデータの続きかもしれませんし、例えば、1行、3行、4行・・・811行・・・にそれぞれ0.001、0.0005、0.002、0.08・・・0.001・・・を加算してあるかもしれません。
何らかの、操作が行われた可能性の高いデータ(どのくらいの確率?)なのかExcelを使って調べるたいと思っています。どうすれば分かるものか具体的な方法を教えて下さい。なお、数学の知識は大昔に勉強した為ほとんど忘れていますので、なるべく、そのまま貼り付けて調べられるよう関数を書いて教えて頂けると助かります。
宜しくお願い致します。
t検定を行います。
たとえば、A1:A1000とB1:B1000が並んでいたとして、この2つのデータの集まりに差があるかどうかを調べるのがt検定です。
Excel関数TTESTを使い、
=TTEST(A1:A1000,B1:B1000,2,1)
としてください。
第4引数の1ですが、AとBに対応関係があるときは1、対応関係はないがデータの分散の仕方が同じだと仮定できるときは2、それ以外は3を代入してください。
一般的には棄却域の確率として0.05を使います。
つまり、TTESTの計算結果が0.05未満だったらAとBには有意差がある、すなわち95%の確率でAはBと違うものと判定できます。
数字の羅列だけを見て判断する公式は存在しないわ。
条件を整えて何度も測定して実証するしかないわよ。
《60》 研究者も人間 ―隠れた作為を見抜く - これって効きますか? - アピタル(医療・健康)
集められたデータは、どのような条件のもとで測定されたものなのか、注意深く見ていく必要があります。
回答いただきありがとうございます。
snow0214さま
2014/05/08 23:18:31コメントありがとうございます。
>乱数からなるデータの集団はは対応関係や分布の性質を持たないので、
>差があるかどうかを調べることは本質的にできません。
なるほど・・・
ただ、Excelの乱数=rand()については、恐らくある数式を元にして生成していると思いますので本質的には同一ではないでしょうか?
たとえ何らかの数式を元に生成しているとしても、同じという検定結果が出たとしたら、乱数として意味をなさなくなります。
2014/05/10 08:58:55なぜなら、t検定で同じだという結果が出るということは、ある5千個の乱数と次の5千個の乱数が同じ分布をしているということで、これでは乱数と呼べないからです。