人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

[統計] これは、作為的なデータですか?それとも、違いますか?

--A(A列)--
0.5008
0.5005
0.4989
0.5008
0.4997
0.5012
0.5013
0.5012
0.4991
0.5028

--B(B列)--
0.5051
0.5005
0.5013
0.4984
0.4905
0.5004
0.4908
0.5034
0.4963
0.4988

A、Bと二つの数値データ(実際は1000行以上あります)があります。
Aについては一切、手を加えていない生データです。
Bについては、もしかするとAのデータの続きかもしれませんし、例えば、1行、3行、4行・・・811行・・・にそれぞれ0.001、0.0005、0.002、0.08・・・0.001・・・を加算してあるかもしれません。

何らかの、操作が行われた可能性の高いデータ(どのくらいの確率?)なのかExcelを使って調べるたいと思っています。どうすれば分かるものか具体的な方法を教えて下さい。なお、数学の知識は大昔に勉強した為ほとんど忘れていますので、なるべく、そのまま貼り付けて調べられるよう関数を書いて教えて頂けると助かります。

宜しくお願い致します。


●質問者: j4mika
●カテゴリ:学習・教育 科学・統計資料
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● snow0214
●150ポイント

t検定を行います。

たとえば、A1:A1000とB1:B1000が並んでいたとして、この2つのデータの集まりに差があるかどうかを調べるのがt検定です。

Excel関数TTESTを使い、
=TTEST(A1:A1000,B1:B1000,2,1)
としてください。
第4引数の1ですが、AとBに対応関係があるときは1、対応関係はないがデータの分散の仕方が同じだと仮定できるときは2、それ以外は3を代入してください。

一般的には棄却域の確率として0.05を使います。
つまり、TTESTの計算結果が0.05未満だったらAとBには有意差がある、すなわち95%の確率でAはBと違うものと判定できます。


Silvanusさんのコメント
質問者は「平均値の差を検定したい」のではないと思いますが。

j4mikaさんのコメント
回答いただきありがとうございます! 試しに、 A1:A5000、B1:B5000に =MOD(INT(RAND()*10),2) を入力し、 =TTEST(A1:A5000,B1:B5000,2,3) を行ってみたところ、何度かRAND()を変動させると、 TTESTの結果が、0.03?0.95程度の値を示しました。 振れ幅が極端に大きくどこまで信頼性のある方法なのか不安があります。 これは本質的には同一のデータと呼べるのでしょうか? dataAとdataBについて比較したところ、0.08となりました。 また、今回のdataAについて、データを8000まで取り、前半の4000と後半の4000で半分に分けて、A,Bのセルに入れて比較してみたところ、0.89という結果でした。 この場合、dataAとdataBは異なるデータである可能性が非常に高いということでしょうか?

snow0214さんのコメント
>dataAとdataBについて比較したところ、0.08となりました。 0.05以上なので差がない(同じ母集団である可能性が高い)ということです。 >何度かRAND()を変動させると 乱数からなるデータの集団はは対応関係や分布の性質を持たないので、差があるかどうかを調べることは本質的にできません。

Silvanusさんのコメント
飽くまで例として「乱数で生成したデータ集団(一様な分布の標本)」を用いているだけであって、質問の本質とは関係無いのではないでしょうか。

j4mikaさんのコメント
snow0214さま コメントありがとうございます。 >乱数からなるデータの集団はは対応関係や分布の性質を持たないので、 >差があるかどうかを調べることは本質的にできません。 なるほど・・・ ただ、Excelの乱数=rand()については、恐らくある数式を元にして生成していると思いますので本質的には同一ではないでしょうか?

snow0214さんのコメント
たとえ何らかの数式を元に生成しているとしても、同じという検定結果が出たとしたら、乱数として意味をなさなくなります。 なぜなら、t検定で同じだという結果が出るということは、ある5千個の乱数と次の5千個の乱数が同じ分布をしているということで、これでは乱数と呼べないからです。

2 ● 井戸端さん
●50ポイント

数字の羅列だけを見て判断する公式は存在しないわ。
条件を整えて何度も測定して実証するしかないわよ。

《60》 研究者も人間 ―隠れた作為を見抜く - これって効きますか? - アピタル(医療・健康)

集められたデータは、どのような条件のもとで測定されたものなのか、注意深く見ていく必要があります。


j4mikaさんのコメント
回答いただきありがとうございます。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ