1170412581 3群のデータの統計処理について教えてください。

具体的なデータはちょっと出せないので
擬似的なモデルを例に出させていただくと

・目的
来年度の採用に備えて「プレゼン能力」「分析力」「独創性」の地域別傾向を見たい

・背景
社運をかけた新製品が2年後には完成予定。各小売店に商品を置いてもらう為にプレゼン能力の高い新人を集めたい。もし、地域別に学生の傾向に差があるとすればその地域で集中的に会社説明会を行うことで有望な新人を多数確保できるかもしれない!
→関東・東海・関西の3地域で分類、傾向を見る。

※参考画像をご覧ください。

ポイントとしては
・サンプル数が3群で異なる
・極端にサンプル数の少ない集団がある
・面接官の人数がサンプルによって異なる

用語等不適切なところがあるかとは思いますが
適切な検定方法、補正方法等ご存知でしたら
教えてください。

回答の条件
  • 1人2回まで
  • 登録:2007/02/02 19:36:23
  • 終了:2007/02/04 21:00:47

回答(1件)

id:tamtam3 No.1

tamtam3回答回数345ベストアンサー獲得回数202007/02/02 23:04:02

ポイント60pt

こんなものに3群のデータ概念を持ち込む事自体がおかしい

そもそも一定数の学生から、ランダムに選べるわけもなく、他の要因で

その日に訪れる学生が大きく影響を受けるというのに、一体何がしたいのかと

地域別に学生の傾向に差があるとすればその地域で集中的に会社説明会を行うことで有望な新人を多数確保できるかもしれない!

唖然

id:snowpeak

申し訳ないです。

そもそもこういったデータに対して統計的処理が可能なのかどうかわからないので全く的外れなことを言ってしまっているとは思います。

「まったくわかってないよ!」と思われることを承知で別の例をあげさせていただくと

「ある特定の山系における広葉樹林、針葉樹林、混合林について複数の判断項目について(保水力、地表徘徊性昆虫の生息数etc)その傾向をみたい」といった感じでしょうか。

重要視するのは

・きれいに3つの集団が分類できる

・それぞれの集団数に大きな差がある(この場合なら広葉樹林が極端に少なかった、等)

・調査項目により欠損値がある(調査中に自然災害等がおこり、全ての項目についてのデータが出せなかった、等)

データ自体はBartlett検定→Kruskal-Wallis検定、Steel-Dwassの多重比較で有意差が出た項目はあったのですが、単純に項目ごとの数値を処理した結果なので、有意差が出てしまっているように思うのです。(出て欲しいんですが…)

上の学生の例で説明すると個々の学生に対して面接官がつけた得点から単純に平均をとってしまうことにどうも違和感があるのです。説明不足&わかりにくくてすみません。

2007/02/03 21:51:28

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません