想定した数値と実際の数値を比較して、分類別に評価したいと考えています。

具体的には、ある問題の正解率(%)を想定した数値と、実際の正解率があります。それが科目別にそれぞれ数十問あるのですが、どの科目が最も精度の高い予測ができたのかを確認したいと考えています。
私は想定と実際双方の差分を絶対値でとって、どうにかすればいいのかなぁとぼんやり考えています。

回答の条件
  • URL必須
  • 1人2回まで
  • 13歳以上
  • 登録:2010/07/08 10:44:21
  • 終了:2010/07/08 17:14:22

ベストアンサー

id:drill256 No.2

かえる回答回数175ベストアンサー獲得回数72010/07/08 13:26:33

ポイント50pt

実際の数値が50%の問題が2問あったとき、

  1. 70% 70%と予想。(やや外れが2回)
  2. 50% 90%と予想。(正解と、大きく外れ)

引き算の絶対値ですと、この場合は同じスコアになります。


個人的には正規分布を使うといいのではないかと思います。

Excelは使えますでしょうか?

A B C
1 予想 結果 スコア
2 0.5 0.5 =NORMDIST(A2-B2,0,0.3,FALSE)
3 0.9 0.5 =NORMDIST(A3-B3,0,0.3,FALSE)

このように入力すると、各問題のスコアが出ます。

全ての問題のスコアを合計すると、その科目の予測スコアとなります。

スコアが高い方が、正確な予想が出来たことになります。


http://support.microsoft.com/kb/827371/ja

http://www.hinkai.com/qc/hensa.html

id:nashirox

詳細な内容でのご返答をありがとうございます!

>引き算の絶対値ですと、この場合は同じスコアになります。

いや、まさに同じ問題意識があったのです。ただ、これを一文でなんと表現するかが思いつきませんでした。

教えていただいた関数で組んでみたいと思いますが、標準偏差を0.3としている理由は=STDEV((A2-B2),(A3-B3))と考えてよいでしょうか?

あと、平均を0とする理由なのですが、=AVERAGE(A2-B2),(A3-B3))だと0.2にすべきかと思いました。この考えは誤りでしょうか?

ご回答本当にありがとうございました。

2010/07/08 14:59:20

その他の回答(2件)

id:YAMADAMAY No.1

やまだまや(真優)回答回数171ベストアンサー獲得回数122010/07/08 12:43:55

ポイント6pt

正規分布や標準偏差で評価するのも一つの方法だと思いますが。

http://q.hatena.ne.jp/dummy

id:drill256 No.2

かえる回答回数175ベストアンサー獲得回数72010/07/08 13:26:33ここでベストアンサー

ポイント50pt

実際の数値が50%の問題が2問あったとき、

  1. 70% 70%と予想。(やや外れが2回)
  2. 50% 90%と予想。(正解と、大きく外れ)

引き算の絶対値ですと、この場合は同じスコアになります。


個人的には正規分布を使うといいのではないかと思います。

Excelは使えますでしょうか?

A B C
1 予想 結果 スコア
2 0.5 0.5 =NORMDIST(A2-B2,0,0.3,FALSE)
3 0.9 0.5 =NORMDIST(A3-B3,0,0.3,FALSE)

このように入力すると、各問題のスコアが出ます。

全ての問題のスコアを合計すると、その科目の予測スコアとなります。

スコアが高い方が、正確な予想が出来たことになります。


http://support.microsoft.com/kb/827371/ja

http://www.hinkai.com/qc/hensa.html

id:nashirox

詳細な内容でのご返答をありがとうございます!

>引き算の絶対値ですと、この場合は同じスコアになります。

いや、まさに同じ問題意識があったのです。ただ、これを一文でなんと表現するかが思いつきませんでした。

教えていただいた関数で組んでみたいと思いますが、標準偏差を0.3としている理由は=STDEV((A2-B2),(A3-B3))と考えてよいでしょうか?

あと、平均を0とする理由なのですが、=AVERAGE(A2-B2),(A3-B3))だと0.2にすべきかと思いました。この考えは誤りでしょうか?

ご回答本当にありがとうございました。

2010/07/08 14:59:20
id:drill256 No.3

かえる回答回数175ベストアンサー獲得回数72010/07/08 16:35:03

ポイント50pt

コメント欄が開いていないので、こちらに書きます。


標準偏差0.3は適当に設定した数値です。

標準偏差はグラフの山の高さと裾野の広さに影響します。

しかし、今回のように、数十問、数科目の標本ですと、微妙に変更したぐらいでは、どの科目が一番かという結果には影響しないと思われます。

なので、0.3、0.325、0.35など、自分で適当と思われる数値を選べばよいと思います。


平均0は、いろんなタイプの人が無限に試行を重ねると、平均は0に限りなく近づくため、0としています。

標本=全体集合と見るか、標本=部分集合と見るかの違いです。

平均を0にしたのは、今回の標本はたくさんの試行の一部(部分集合)と見なして計算した方がよいと考えたためです。

なお、標本=全体集合と見るならば、標準偏差も標本から計算して求めた方がよいと思います。


この質問は、とてもおもしろく感じました。

平均点のコントロールとか、点数配分の公平化のようなことを、予測によって行えるなぁと思いました。

実際の利用法はよく分かりませんが、お役に立てたら幸いです。


(まだ質問がありましたら、コメント欄のオープンをお願いします。)

http://www.ipc.shimane-u.ac.jp/food/kobayasi/normdist%20by%20exc...

id:nashirox

ご回答ありがとうございます。


>標本=全体集合と見るならば、標準偏差も標本から計算して求めた方がよいと思います。


今回の標本=全体集合なので、標準偏差や平均値も標本から計算して求めたいと考えます。

いろいろ教えていただきまして、誠にありがとうございます。


>平均点のコントロールとか、点数配分の公平化のようなことを、予測によって行えるなぁと思いました。


上で drill256様が記載されていますことを私も考えております。学習塾みたいなところに勤めていますが、模試の品質管理は大きなテーマと考えているからです。

実際のところ、供給サイドは作りたい問題を作るだけで、厳密な意味でその問題がある特定の時期にある層を対象としたとき、どの程度の正答率が得られるのか、というところまで詰めておりません。

学校によっては結果が悪ければ、試験前だから本番で簡単に感じられるようあえて難しくしたといい、結果が良ければ、自信をつけるために簡単にしたんだと言いさえします。

高い出題精度があれば、それは需要サイドの受講生たちに少ない問題数でより高い学習効果を与えることができます。

その第一歩として、今回から出題者に正答率の予想を立ててもらうことにしました。しかし、その評価手法については確立ができていないままだったので、今回質問させていただいた次第です。

ご回答いただいたことで、かなり道筋がつきました。

重ね重ね、御礼申し上げます。

2010/07/08 17:08:10

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません