最低何人ぐらいいたら、偏差値は指標として使うことが出来るのでしょうか?もしくは、分布によって偏差値を使用するかどうかが変わるのでしょうか?
人力検索はてな - 質問一覧
私の経験では150人ぐらいで偏差値でてきましたよ。70人いればだいじょうぶだと思います。40人では少ないと思いますが…曖昧ですみません。
人数云々よりも、得点分布が正規分布に近いかたちになっているかどうかが重要なのだと思います
正規分布に近いかどうかは、目で見て判定するという形でしょうか?
Yahoo! JAPAN
私の母校は120人ぐらいなので校内偏差値を出していましたが、田舎のほうの学校の子は、里の大きな学校と合わせて偏差値を出しているそうです。そうしないと、基準が作りようが無いんで、必然的に偏差値も・・・。70人程度なら偏差値は出せると思いますよ。
おっしゃることは私もそう思うのですが、裏付けがわかればうれしいです。
相対的な評価である偏差値は、例えば今回の場合、点数分布が正規分布を成している必要があります。
逆に言えば、正規分布を大きく外れる点数分布であるならば、偏差値は意味を成さないということです。
サンプル数も当然重要ですが、点数分布が正規分布を成しているか否かを一つの基準にするのは有用かもしれません。
如何でしょうか?
正規分布かどうかチェックする方法ありますか?
株式会社ビューポイント情報科学研究所(VPI)
URLはダミーで我が社のものです。
そもそも偏差値とは何かですが、生徒の点数の分布は正規分布する、すなわち平均点を中心に富士山形に分布するという前提に基づき、平均値を50点、標準偏差を12.5に換算したときの各生徒の点数です。例えば、同じ60点を取っていても、平均点より良いのか悪いのか、平均点より良くても平均点からどれくらい遠ざかっているのかを偏差値と言う形で均一化して、問題の難易度のばらつきによる点数の差をなくそうというものです。統計学に基づくものですから、本来は最低1万人くらいの人数でないと意味がありません。70人くらいでも偏差値は計算すれば一応出ますが、誤差は大変大きくなります。ただ、40万人規模の国立大学等のセンター試験でも正規分布はしないということが実証されているので、いずれにせよ誤差は出ます。まあ、気休めと言うことだったら100人でもよろしいのではないでしょうか。100人でもきれいに点数が富士山形に分布していれば、偏差値に信ぴょう性は出ます。なお、1万人規模でも計算してみると、偏差値は5点程度の誤差を持っています。そんな程度のものに基づいて「進路指導」と称して生徒に志望校の受験をさせないというのは、私はどうかと思います。
遊びで偏差値出してみたよーっって書いておいたほうが良いようですね.
URLは参考です。
このクラスの各個人の偏差値がいわゆる受験ガイドに載っているような基準偏差値と比較して意味があるかと言うと無いでしょう。
偏差値と言うのはその集団に対して、自分の数値が平均と分布を鑑みてどの程度違うかということになるので、クラス内での競争意識をつける為であれば意味があるでしょうが、それであれば平均値と順位で十分でしょう。
何人だったら意味があるかというよりも、クラスの70人に対して、何を訴えたいか、伝えたいかと言う目的がまずあって、それを実現できる道具として統計手法を選んだ方がいいと思います。(偉そうですみません)
母集団が万単位になるような時は完全に無作為にサンプリングできるのであっても300個くらいのデータが無いと統計的には十分と言えないという話は聞いたことがありますが・・・。
ありがとうございます。
人数よりもテストを行っている集団のレベルよって出た偏差値が違います。それは予備校など大人数でもこのサイトのように同じです。
出した偏差値を、クラス内での位置づけを見るのに使うのなら意味はあると思いますが、そのまま赤本などに載っている偏差値と比べてレベルを見ることは意味がないかと思います。
ありがとうございます。
正規分布とは、こんな形の分布のことです。さまざまな測定のばらつきは、正規分布に近い形で分布すると言われていて、計算が容易なため、ばらついているデータを統計的に処理するのに、このモデルがよく使われます。
偏差値も、このモデルを使った統計手法の一つで、データを、平均を50、標準偏差を10として標準化して、類似のデータと比較しやすくするためのものです。
偏差値を出す意味があるかどうかは、偏差値を何の目的で使うかにもよります。通常のテストで偏差値を使う場合は、単に比較の便利さのために使っているのだと思いますので、サンプルが何人だろうと(1人や2人でなければ)それなりの意味はあるのではないかと思います。偏差値に意味がないようなデータならば、平均値にも意味がないことになってしまうので、比較することが不可能になってしまいますしね。
もっと厳密な判断が必要なケースでは、それなりにいろいろと手法があって、偏差値だけで判断するということはあまりないように思います。
あまり気にせずに使ってもよいのではないでしょうか?
ありがとうございました。
http://www.hatena.ne.jp/awindow?qid=1080539285
awindowさんのプロフィール - はてな
URLはダミーです。
おっしゃる通り、偏差値はデータの母集団が正規分布していることが前提になっていますので、データの分布をチェックして正規分布と言えるかどうかにより偏差値の信頼性は大きく違ってきます。
従って、データ数が大きくても、はっきりと山が二つあるような分布の時は一塊として処理をしますと信頼性が低くなり、判断を誤る危険がありますので層別をして評価する必要があります。
正規性は度数分布を見れば大体分かりますが、「ひずみ(b1)」「とがり(b2)」と言う値があり、前者が-0.7と+0.9の間、後者が-0.4と+1.2の間なら普通の正規分布と考えても良いことになっています。
最近は、電卓で簡単に標準偏差や偏差値が出てきますので、母集団の分布に関心を払わないケースが多くとんでもない間違いをすることがありますので要注意です。
私の経験では、正規性さえしっかりしておれば25以上あれば大体使えると思っています。
なるほど、正規性を確認する方法があるのですね。ありがとうございました。
正規分布%20ヒストグラム
正規分布かどうかは、ヒストグラムを作れば一目瞭然だと思いますが。
点数のヒストグラムが中央が高く両側に同じように下がっていれば
正規分布と言ってしまってまず問題ないでしょう。
もしも山が2つになっていたりする場合は正規分布とは
言えないので偏差値は使えないでしょう。
一つの山に見えたら…って正規分布って大まかに考えても良いようですね。
http://www.hatena.ne.jp/1080539285#
70人ぐらいでテストをして偏差値を出しました。あるサイトでは40人ぐらいのクラスで偏差値を出しても意味がないということをでした。 最低何人ぐらいいたら、偏差値は指標.. - 人力検索はてな
「何人以上なら良いか」という明確な回答はありません。
正規性を確認(これも正規分布とは認められないわけではない程度のあいまいな答え
しか示してもらえませんが)するための回答はいくつか出てくると思いますので、
正規分布とみなしてよいラインはどこにあるかについて。
分散が未知の場合、正規分布ではなくt分布に従うと考えるべきで、それはnが
小さいときには無視できないほどのズレがあります。(この辺りの理論は、t分布
で検索をかけてみてください)
そのnが30を超えたときに、だいたい正規分布と見なしてもよいだろうというのが
一般的な考えです。
このあたりを参照。
その他、試験成績などは正規分布ではなくワイブル分布に従うなんて話を
どこぞの学会で聞いた記憶があるのですが、専門外なので割愛させていただきます。
ありがとうございました。検索してしらべてみたいと思います。
http://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/normaldi...
適合度の検定−−正規分布への適合度の検定
あるデータがある特定の分布と同じであるといえるかどうか確かめる方法は、一般に分布の適合度検定といって、統計でよく研究されており、広く使われる方法がいくつかあります。ここには一つのやり方がのっています。同ページの計算プログラム [JavaScript] が簡単でしょう。
40人ぐらいというのは経験的にということでしょうが、統計的にはデータに依存して決まる話です。この計算をすれば、データと人数を考慮した判定ができます。
ここのカイ自乗の絵と説明が一般的に参考になるかも知れません。検定の考え方としては、手元のデータで計算した有意確率(P)があらかじめ決めた有意水準αより小さければ、「ある仮説(データが正規分布に従う)のもとではP以下の確率でしか起こらないくらい、手持ちのデータは仮説(正規分布)とズレテいる」ので、正規分布でないと「みなし」ます。α以上なら正規分布と考えてもいい(くらいズレが小さい)、という結論になります。後者の場合、正規分布と主張するには不十分ですが、否定できないからそう考えてもいいですよね、ということです。仮に正規分布からサンプル抽出したデータでも、確率αで、同じくらいのズレは起こり、したがって正規分布でないとみなされることもあります。逆に正規分布でないデータを正規分布とみなすタイプの誤認識もありえます。
αとしては0.05 とか0.01を慣例として使いますが、これはどれくらいしっかりした結論を出したいかに応じて決めればよいと思います。0.01に設定するほうが(小さくするほうが)、ずれているとみなされにくいです。よって、正規分布でないという結論がでたときには、その結論が正しい可能性が高い。蛇足ですが、ランダムにくじを引いても正規分布になるわけで、もし正規分布だからといってよいテストと考えるとしたら、その理由だけでは本質からずれていると思います。
ありがとうございました。
たしかに、何人でもエクセル使えば出せるんですが、そのあたりのバックグラウンドがないのでどうやって確認したものかと…