正確な値(目標値)がわかっており、それに対して、比較したい値(解析データ)を何種類かもっています。一列*3000行のデータなのですが、どれが正確な値にもっとも近いかを評価したいときどのようにして統計をとって評価したらよいのかわかりません。エクセルで計算を行いたいと思います。どのような方法があるか教えてください。

回答の条件
  • URL必須
  • 1人3回まで
  • 登録:2007/10/24 18:42:45
  • 終了:2007/10/29 19:22:04

回答(4件)

id:kn1967 No.1

kn1967回答回数2915ベストアンサー獲得回数3012007/10/25 01:58:01

ポイント75pt

例1)目標値がA1-A3000に存在し、B1-B3000・・・Z1-Z3000に比較したい値がある場合

CORRELワークシート関数にて相関係数を算出して比較する
=CORREL(A1:A3000,B1:B3000)
    ・
    ・
=CORREL(A1:A3000,Z1:Z3000)

これらの中で一番大きな数値を返した列が最も相関が高い(目標に近い)と言えるのですが

相関計数はデータの散らばり具合を比較しているだけなので

データの推移なども加味する必要がある場合には信用できない結果となりますので注意が必要。

http://office.microsoft.com/ja-jp/excel/HP052090231041.aspx


例2)目標値がA1に存在し、B1-B3000に比較したい値がある場合

C列にて差を求め
=A1 - B1
    ・
    ・
=A1 - B3000
B列とC列を選択した状態にて、C列を昇順にて並び替える

とりあえず、2例を挙げてみましたが、上記にて注意が必要と書きましたように

何をどのように解析した結果であるのかが判らない(データの性質が判らない)状態では

どのような統計的手法を用いるのが適切であるのかを絞り込む事が出来ませんし

そもそもの問題として貴殿が統計的手法についてどの程度ご存知なのかもはかりかねますので

許す限りの範囲でサンプルデータを提示なさってはいかがでしょうか。

(私に時間が無い、あるいは知らない分野のデータであれば、

続けての回答は致しません事ご了承願います。)

id:lllmakikolll

ありがとうございます。例1のほうが私のデータに近いと思われます。

私のデータは時系列に移動量が変化していて、B1が正解値

    B1      C1     D3

1秒  0cm     0.2cm    0cm 

2秒  1.5cm    1.52cm   1.54cm

3秒  1.53cm   1.54cm   1.53cm

...といった具合のデータで、お察しのとおりデータ的に推移も加味されるものだと思われますが。

統計的手法については分散は勉強しましたが、知りません。

一応CORREL関数で値を出してみたいと思っています。

CORREL関数について、数学的にどういう意味なのかも教えていただけるとありがたいです。 

2007/10/27 17:55:04
id:Z9M9Z No.2

Z9M9Z回答回数343ベストアンサー獲得回数112007/10/25 08:33:03

ポイント23pt

解析データをソート(「データ」→「並べ替え」)すると、正確な値のどのくらい近所にいくつくらい解析データがあるかわかりやすくなります。

ついでに折れ線グラフにしましょう。それに「正確な値」の水平線を重ねると、その値周辺での分布の様子が分かりやすくなります。

「どれが一番近いか」を見るのではなく、解析データ全体が「正確な値」にどのくらい近いかを計るには、解析データと正確なデータとの差(絶対値、=abs(各解析データ,正確な値))をとって、その平均をとるとわかります(それをまとめたavedevという関数もあるようです)。世間で通りのよい「標準偏差」がほしいなら、その2乗の平均をとります。

http://www.qmss.jp/e-stat/excel/commands-stat.htm

id:Wize No.3

Wize回答回数65ベストアンサー獲得回数92007/10/25 13:30:48

ポイント5pt

あまり統計的に難しくなく、関数を使わずに直感的に理解できる方法としては、

「差の2乗の平均」を取るという方法があります。分散と言います。

例えば目標値がA1~A3000に入っていて、

解析データの一つがB1~B3000に入っているなら、

c1=(A1-B1)^2 とし、それをC3000までコピーして、

C1~C3000を全部足して3000で割ったものになります。

これが小さいほど、目標値に近いということになります。

参考になればよいのですが……。

↓わかりやすい解説サイト

http://kogolab.jp/elearn/hamburger/chap1/sec0.html

id:Wize No.4

Wize回答回数65ベストアンサー獲得回数92007/10/25 13:50:45

ポイント5pt

あ、分散は平均値からの差でした。

ごめんなさい、用語、違ってますね。

上で示した値に名前はついていないかもしれません。

申し訳ありません。

ついでにお勧めの本を紹介しておきます。

http://amazon.co.jp/o/ASIN/4621042696

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません