人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

分散と標準偏差の感覚的(?)な直感的な説明はできますか?

よく標準偏差とか聞くので検索してみたら

標準偏差=分散の平方根

分散=偏差の2乗の合計

偏差=各データの平均との差

一体、何をしてるんですか??

偏差は、百歩譲って良いとして(バラツキを求めたいので。)
偏差の2乗って、負の偏差を正にしたいからだけ? (そんな不純な動機で2乗してよいの?)
しかも、それを合計してしまっています。(この辺から わけがわからなくなっています。)
さらに、平方根とってます。(そのままでも、いいのにと思ってしまったり。大小関係は失われないでしょ?)

うーん…。(?_?)



●質問者: suzume_oyado
●カテゴリ:学習・教育 経済・金融・保険
✍キーワード:けが データ 小関 平方根 感覚
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● idetky
●27ポイント

まずは分散から。

分散とは「ばらつき具合」ですよね。すると基準となる値から大きい方向にずれてても、小さい方向にずれてても「ばらつき具合」という観点では同じです。そのため正の値にする必要があります。

それならばなぜ「絶対値」を取らないか。それは、「絶対値」を使った場合、それは数学的な話ですが、微分不可能な部分が出てきてしまいます。二乗した場合は二次関数となるので微分不可能なところがなく、統計を数学的に扱う時に非常に楽になるからです。



次になぜ「ばらつき具合」である分散の平方根をわざわざとって「標準偏差」というものを作るのかということですが、直感的に言うとこれは「単位」の問題が絡んできます。

例えば、平均値5cmとあるサンプル値7cm差は2cmですよね。分散では、この差を2乗します。すると値は4で、その「単位」は【cm^2】という単位になります。この値は確かに「ばらつき具合」を示していることはわかりますが、「じゃあどれくらいのばらつきなの?」って疑問を持ったとき、単位が【cm】ではなく【cm^2】のままだと、直感的にも良くわからない値ですよね。

そこで分散の平方根をとることで、その単位を元に戻してあげて「標準偏差」というものを用意してあげると直感的にもそのずれ具合がわかりやすくなります。



本当はもっとちゃんとした理由があるのですけどね^^

直感的な理由ということで説明してみました。

◎質問者からの返答

>それならばなぜ「絶対値」を取らないか。

おおっ。

>微分不可能な部分が出て

な、何とっ。

いまいち、どれが二次関数になるのかわかりませんが、そういう要請が

あるという事は理解しました。

>「単位」の問題が絡んできます。

わくわく…。

>単位が【cm】ではなく【cm^2】

なっ、なんと!!確かに・・。

す、すごいですね…。理にかなってます!

ありがとうございました!!

適当に、2乗したり平方根とってるわけではないのでね(笑)

他の方の説明も引き続きお待ちしています。


2 ● taka27a
●27ポイント

両方とも同じ概念を表します。

ただ、分散の単位は (標本の単位)^2 になっていて、そういう意味では使いにくいので、

(標準偏差)=√(分散)

で定義すると、標準偏差の単位は、標本の単位と一緒になります。

単位が違うだけで、どちらも表す意味は同じですよ。

http://kogolab.jp/elearn/hamburger/chap1/sec4.html

参考まで。

◎質問者からの返答

単位が違うという事ですね!


3 ● rsc
●26ポイント

こちらは参考になるでしょうか。

・分散とは?

>分散とは,それぞれのデータが平均値を中心として,どれだけ離れているか,その距離の2乗した値の平均となっています。散らばり具合を見る目安となっています。それにルートをつけたものが,標準偏差となっています。

計算がし易いのは分散で,目で確かめ易いのが標準偏差だと考えて下さい。

>分散 σ2 は変量 の平均値であるから,変量 x の測定単位が,たとえば cm であるとき,分散の単位は cm2 になってしまいますので,単位を一致させるために,分散の正の平方根 σ を取り,これを変量 x の標準偏差と言います。

http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/avgvar0/avgvar...

∴分散の方が先!です。

データのばらつきを見るのに、偏差xi-x(平均)を見ればいいのですが、単純に平均するとプラスの項とマイナスの項が打ち消しあって0になってしまい意味がなくなってしまいます。それで、分散は偏差の2乗の平均になっています。下記URLが参考になります。

・ばらつきを数字にする

http://kogolab.jp/elearn/hamburger/chap1/sec3.html

ちなみに、データのばらつきを表す量として、平均偏差(1/N)?|xi-x(平均)|と言うのもあります。x(平均)は、xの上にバーがあるものです。書きにくいのでお許しください。平均偏差じゃなくて分散を使うのは、分散の方が数学的に扱いやすいからです。

http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/mean-dev.html ←式

http://q.hatena.ne.jp/1121168431

◎質問者からの返答

ハンバーガー統計学いいですね。ブックマークしました。

ありがとうございました!

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ