こんな例の場合、どの検定を用いればいいですか?


あるクラスの男子30人女子25人の一番好きな食べ物を調べました。

男子 ハンバーグ 12人
カレーライス 9人
オムライス 5人
ラーメン 4人

女子 カレーライス 9人
ハンバーグ 6人
オムライス 5人
ラーメン 5人

この場合、男子のハンバーグの人気は女子よりも有意に人気があるといえますか?
これを検定する方法をご教授ください。

回答の条件
  • 1人5回まで
  • 登録:2009/04/22 23:47:14
  • 終了:2009/04/27 14:15:34

ベストアンサー

id:nobnob3 No.7

考え中回答回数324ベストアンサー獲得回数292009/04/25 20:23:15

ポイント30pt

男と女でその比率が異なるということを検定したいのであれば, RxC表を使った検定になると思います。

英語サイトですが、計算できるところがありました。

http://www.physics.csbsju.edu/stats/contingency_NROW_NCOLUMN_for...

id:gdyskyblue

いろいろな方々から回答をいただきましたが、この方法が一番適切のようでした。早速検定してみました。

ありがとうございました。

2009/04/27 14:07:17

その他の回答(7件)

id:Fika No.1

Fika回答回数21ベストアンサー獲得回数22009/04/23 00:21:10

ポイント20pt

文章中の検定は、統計という意味で捉えてよろしいのでしょうか。

女子と男子別のグラフを表計算ソフトで描いて証明すればよいのではないでしょうか。

id:gdyskyblue

統計という意味ではなく、有意差があるかどうかを5%ないしは1%の危険率を持って検定するという意味です。

再度ご教授いただければ幸いです。

2009/04/23 07:40:41
id:hijk05 No.2

hijk05回答回数1307ベストアンサー獲得回数232009/04/23 09:17:31

id:gdyskyblue

この検定を行うことに意味があるかないかを判断するのは私であってあなたではないはず。

これはあくまで例であり、かつ数学的な問題であり、学術的に検定を行うことに意味があるのであって、結果に対する価値を求めるものではありません。

提示していただいたURLは勉強にはなりますが、私の問いに対する参考にはなりません。

2009/04/23 09:35:23
id:rsc96074 No.3

rsc回答回数4391ベストアンサー獲得回数4022009/04/23 11:47:08

ポイント15pt

●比率の検定

http://next1.cc.it-hiroshima.ac.jp/MULTIMEDIA/statistics/node20....

 上記URLの「例題 4.6」を次のように、問題変形したら、使えそうですね。どうでしょうか。

>「好きな食べ物」調査で,「ハンバーグ」について男性は「30」人中の無作為標本中「12」人が,女性は「25」人の無作為標本中「6」人が好きと答えた.実際に男女の好みに差があるといえるか,有意水準5%で検定せよ.

※参考URL

●統計学入門

http://next1.cc.it-hiroshima.ac.jp/MULTIMEDIA/statistics/statist...

id:gdyskyblue

丁寧な回答をありがとうございます。しかし、提示していただいた方法での問題変形で本当に求める検定が可能かどうか難しいところです・・・・

よく検討し、一度計算してみます。

ありがとうございました。

2009/04/23 16:53:44
id:dungeon-master No.4

dungeon-master回答回数571ベストアンサー獲得回数402009/04/23 15:12:57

ポイント15pt

>この場合、男子のハンバーグの人気は女子よりも有意に人気があるといえますか?

いいえ。

このアンケートでは「男子は女子よりハンバーグが好きが多い」かどうか判定するような

検定方法を見出すのは、結構難しいです。

有意差があるかどうかの検定を行なう前に、どういった性質のサンプリング結果であるかを

吟味する必要があります。

さもないと適切な検定方法を選ぶのが大変ですし、有意かどうか以前に、検定すること自体

無意味になる危険があります。


・サンプリングが適切だったか

アンケート方法の条件付けが不明確です。

「この4品目中で一番好きなものは?」というアンケートだったのか、

「一番好きな料理は?」というアンケートで たまたま おなじ4品目が出揃ったのか。

前者なら、寿司、スパゲティが選択肢に登場していると順位変動するかもしれません。

後者なら、統計的にみて不自然なのでサンプル数が足りないのかもしれません。


・集計結果が統計上の操作を受けている

このアンケートでは、集計結果から求めた順位はついていますが、本来の個人がつけた

順位付けから「1位の数だけ拾った」という不適切な集計が含まれています。

カレーが一番好き、ハンバーグが一番好きという「人数」を、男子女子というカテゴリで

分けたので、統計上の見かけの順位である可能性を払拭できません。

アンケート結果が「○○が好きか?」のY/Nの数ではないところが問題です。

同じサンプルに対してハンバーグが好きか、カレーが好きか、を個別にY/Nで採って

いったとすると、カレーY>ハンバーグY となる可能性が十分残されています。

(そういうわけでrsc96074さんの言う問題置き換えをすると意味が変わってしまいます)

id:gdyskyblue

詳しいご指摘、ありがとうございました。質問内容は例であって、実際に検定したいサンプルはn=25(グループA)とn=58(グループB)です。ある事象に基づきグループAとBに分けています。このグループAとBに共通に4つの事項(例では一番好きな食べ物、グループAもBも同じ4項目です)について、グループAで一番多かった事項(例では男子のハンバーグ)がグループBよりも有意に多かったかどうかを検定したいと考えています。また、この一番好きな食べ物で例えた4つの事項はそれぞれに順位がつけられるような事象ではなく、それぞれが独立した事象です(具体的にはグループAにもBにもひとつだけ必ず存在するものの場所です)。

抽象的な表現ばかりでわかりづらいかと存じますが、補足説明すると以上のとおりです。

再度ご教授いただければ幸いです。

よろしくお願いいたします。

2009/04/23 16:57:38
id:Hyperion64 No.5

Hyperion64回答回数791ベストアンサー獲得回数842009/04/25 17:36:16

ポイント15pt

男(M)と女(W)の2グループが、ハンバーグを一番とする(Humberg)か、そうでないか(Non-Hum)に

分けて、このグループで違いがあるかどうかを検定するやり方は使えないでしょうか。

2×2分割表のカイ自乗検定です。

試しにやってみました。所与のデータは下表になります。

M W 計

Humberg 12 9 21

Non-Hum 18 16 34

計 30 25 55

ここでMとWのグループに違いがないという仮説を有意水準0.05で検定すると

カイ=0.09

p値=0.76>0.05

となり、仮説が棄却されます(違いがあるとはいえない)となりました。

id:gdyskyblue

例では仮にハンバーグを挙げましたが、ハンバーグ以外の要素が有意差を持つかどうかも見たかったので、下記の回答のようにR×Cの表を用いた検定を行うことにしました。回答ありがとうございました。

2009/04/27 14:06:10
id:nobnob3 No.6

考え中回答回数324ベストアンサー獲得回数292009/04/25 20:17:09

ポイント15pt

カイ二乗検定で良いです。

2x2の表を作って計算します。

以下計算結果です。

食物の種類 | 男 女| Total Exposed

-----------+------------------------+------------------------

ハンバーグ |12  6 | 18 0.6667

そ の 他 |18 19 | 37 0.4865

-----------+------------------------+------------------------

合   計 |30 25 | 55 0.5455

解析結果 | Point estimate | [95% Conf. Interval]

Odds ratio  | 2.111111 | .5721478 8.31398 (exact)

Attr. frac. ex. | .5263158 | -.7478001 .8797207 (exact)

Attr. frac. pop | .3508772 |

chi2(1) = 1.59 Pr>chi2 = 0.2080

ということでp値が一般的な0.05よりも高いために、統計学的な有為差がないということになります。

ただし、オッズ比は2倍以上なので、調査人数が増えると統計学的有為差が出る可能性があります。

id:nobnob3 No.7

考え中回答回数324ベストアンサー獲得回数292009/04/25 20:23:15ここでベストアンサー

ポイント30pt

男と女でその比率が異なるということを検定したいのであれば, RxC表を使った検定になると思います。

英語サイトですが、計算できるところがありました。

http://www.physics.csbsju.edu/stats/contingency_NROW_NCOLUMN_for...

id:gdyskyblue

いろいろな方々から回答をいただきましたが、この方法が一番適切のようでした。早速検定してみました。

ありがとうございました。

2009/04/27 14:07:17
id:nobnob3 No.8

考え中回答回数324ベストアンサー獲得回数292009/04/26 03:07:00

ポイント15pt

コメント欄に書きたかったのですが、開いていなかったので済みません。

日本語では、

やはり青木先生のページがよくまとまっていると思います。

http://aoki2.si.gunma-u.ac.jp/exact/fisher/getpar.html

http://aoki2.si.gunma-u.ac.jp/exact/exact.html

dungeon-masterさんの指摘はもっともだと思いますが、男女の間でデータの集め方に差がなければ、

差があるかどうかの検定は可能だと思います。

>4つの事項はそれぞれに順位がつけられるような事象ではなく

統計ソフトを使えば、どんな検定も簡単に出来ます。

しかし、どの検定を選ぶかは、標本の数が十分に大きいか、等分散性を前提できるか、

順位があるかないかなど複数の要素を加味する必要があり、結構難しい問題です。

id:gdyskyblue

質問を提示させていただいてから自分なりに学習し、皆さんの回答を参考にいたしました。

やはりm×n表を用いる方法が適切かと思いました。

統計学の専門ではないので、本当に検定して意味があるのかどうかはなんともいえませんが・・・・・

丁寧なご指導、ありがとうございました。

2009/04/27 14:12:12

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません