http://www.iam.u-tokyo.ac.jp/bnsikato/protocol/4-12.html
この手の解説は結構ウェブ上で見つかりますが一応ここを示しておきましょう。
t検定はまず得られる価が正規分布をなす必要がありますが、何も考えずt検定というケースが多いです。正規分布をなすというのは
例えばx=yの関係(1次式で表すことができる関係で)xを実験条件で設定してYを観測するとします。xが正規分布をなせば、yもそのはずですよね。xは実験誤差でくるう可能せいがあります。
例えば1グラム測って実験に使うとします。
実際は1.01gだったり0.96gだったりするわけですがこの価の分布はたぶん正規分布をなすでしょう。したがってYも正規分布をなすといえるので、t検定が使えるということになります。
正規分布をなさない場合xとyの関係が分かっていればその関係から修正して検定することが可能です。
さて、サンプルのばらつきが大きくでもなんだか差がありそうだというとき、例えば得られた数値がコントロールで1から6までバラついて、サンプルのあたいが5から9位までバラついているようなとき、ノンパラメトリック検定がいいと考えられます。Wilcoxon 符号付順位和検定やMann-Whitney検定です。そしてこれは正規分布をなさない場合の検定法ということになります。
対応のあるというのは、例えばAさんが薬を飲む前は赤血球の数がa(0)だったとしましょう。薬をのんだあとa(1)になったとします。そしてBさん(b(0),b(1))Cさん(c(0),c(1))とデーターを取っていくわけですが対応なしの検定ではa(0), b(0), c(0),,,の平均を取ってSDをもとめて、同様にa(1), b(1), c(1),,,の平均を取ってSDをもとめて、平均値とSDから有意さを検定するわけです。
対応のある検定ではa(0)がa(1)に対応しているという考慮を計算のなかに入れて検定する方法です。
あと得られた値の中にはずれ値がありそうな時、それがはずれ値かどうかを検定してはずれ値でるときはその値を使わないという方法もあります。
質問の主旨と違ったら申し訳ありません。
統計学の検定は、次のように考えるとわかりやすいと思います。
何かを測定する。神(科学は西欧で発達しているので、こうした発想がでてくるわけです)が行えば、何回やろうとも同じ値(=真の値)が出てくる。しかし、人間が行うと、どうしても真の値からずれる(=誤差)ため、確率的な処理が必要になるわけです。
2集団の平均を比較する場合、「平均が同じ/平均に差がある」のいずれかが結論になりますが、神が行えば、当然、2集団の平均それぞれの真の値がわかるので、間違えない(=誤謬がない)。しかし、人間が行う場合、真の値がわからないので、間違える(=誤謬を犯す)ので、確率的に処理をする(これでなぜt検定を使うのかは省きます)。
2集団の平均の比較での誤謬には、神がみると「平均が同じ」なのに、「平均に差がある」と間違えるものと、神がみると「平均に差がある」のに「平均が同じ」と間違えるものがあります。
「2集団の平均に差がある」という仮説を、有意差検定するとき、「2集団の平均に差がない」という帰無仮説を棄却できるかどうかがポイントになっています。
ここで、有意差なしという結果がでた場合、神がみて「平均が同じ」なら正しい結果、神がみて「平均に差がある」なら誤った結果(……ア)ですね。
逆に、有意差ありという結果がでた場合、神がみて「平均に差がある」なら正しい結果、神がみて「平均が同じ」なら誤った結果(……イ)です。
では、「有意水準5%で有意差があった」ということはどういうことか? これは、「イの誤りを犯す可能性5%(100回棄却したら5回は誤りの棄却になるということ)までを許す条件のもとで、2集団の平均に差がないという帰無仮説が棄却された」と言っているのです。
有意水準を1%にすると、「イの誤りを犯す可能性1%までを許す」ということになりますから、条件としては厳しくなっているわけです。
http://www.wwq.jp/indsta/indsta25.html
それぞれの統計量の検定が、なぜそれぞれのやり方なのかに関する理論的な説明は(学生でなくなって長いので)忘れてしまいました。
コメント(0件)