大学の課題でエクセルを使わずに手計算で相関係数を出さなければならないのですが、教官に教わった計算式がどうも間違っているようなのです。何度計算しなおしても、計算式を使って出した答えとエクセルを使って出した答えが一致しないのです。
以下の計算式で、どこか間違いがありましたら訂正してください。
(iは任意の数、XmはX1〜Xnの平均です)
共分散の分子
Σ(Xi-Xm)(Yi-Ym)
=ΣXiYi-XmΣYi-YmΣXi+ΣXmYm
=ΣXiYi-Xm・nYm-Ym・nXm+nXmYm
=ΣXiYi-nXmYm
分散
Σ(Xi-Xm)^2
=ΣXi^2-2ΣXiXm+ΣXm^2
=ΣXi^2-2nXm^2+nXm^2
=ΣXi^2-nXm^2
分かりにくくてすみません・・よろしくお願いします。
迷ったときは、面倒ですが長ったらしく展開してみると良いと思います。
Σ(Xi-Xm)(Yi-Ym)
= (X1Y1 - X1Ym - XmY1 + XmYm) + ・略・ + (XnYn - XnYm - XmYn + XmYm)
わかりやすくするために計算上は無意味な()を入れてあります。
組み合わせは4つ
1)X1Y1~XnYn
2)X1Ym~XnYm
3)XmY1~XmYn
4)XmYm~XmYm
あなたの結論であるところの、
=ΣXiYi - nXmYm
では、何かが欠けてませんか?
asahi.com:朝日新聞の速報ニュースサイト
共分散の計算で、ΣXmYmはnXmYmではなく、XmYmではないでしょうか(XmとYmはともに定数なので)。ですから計算していくと、
=ΣXiYi-nXmYm
ではなくて
=ΣXiYi-XmYm
となるのではないでしょうか。
数式は弱いので、ご質問の趣旨のそった回答でないのでポイントは結構です。
こちらのページに求め方の解説があります。
この青木先生のサイトは非常に役に立ちます。
分散の求め方です
標準偏差の求め方です
URLはダミーです。
分散の式ですが、”分散の分子”であれば、書かれているとおりですが、”分散”であれば、nで割る必要があります。
共分散の分子の式変形で、
ΣXi=nXm、ΣYi=nYm
を使っていますが、ΣXi、ΣYiがnで割り切れない数だとすると、コンピュータ上の計算では、上の等式は成り立ちません。答えがどのくらいずれているのかわかりませんが、ずれが小さいとすると、これが原因とも考えられます。
ぱっと見て気づいたのは上の2点です。
失礼しました。ご指摘の通り、分散の方も“分散の分子”でした。
具体的な数値は ΣXi=182.8、ΣYi=361.5、n=20
で、ΣXiとΣYiはnで割り切れるのです。
本来ならマイナスの相関になるはずなのですが、自分で計算するとプラスの値になってしまいます。マイナスのところがプラスで出て来るぐらいなので数値のずれもかなりあります。
質問を登録してからも何度も計算をしなおしているのですが・・・。もう一度始めからやってみます。
先ほど回答2で見当違いな回答をしてしまいました。申し訳ありません。もう一度見直しましたが式は合っている気がします。
回答4に対するコメントで相関の符号も違っているということでしたが、分散と共分散のそれぞれの符号を確認されてはどうでしょうか。分散の符号は必ず正になりますから、分散の符号が負になっていれば、分散の計算のところに間違いがあることになります。分散の符号が正になっていれば、共分散の計算の方がおかしいことになりますよね。それで多少間違っている箇所が絞れますかね。答えになってなくて済みません。
分散の値は正なので、やはり共分散の計算がおかしいようです。
もう一度計算しなおしてみます。
http://www.hatena.ne.jp/1138642778#
人力検索はてな - 計算に強い方、助けてください。 大学の課題でエクセルを使わずに手計算で相関係数を出さなければならないのですが、教官に教わった計算式がどうも間違っているようなので..
ΣXi/n=Xm=182.8/20=9.14
ΣYi/n=Ym=361.5/20=18.75
(共分散の分子)=ΣXiYi-nXmYm=ΣXiYi-20x9.14x18.75
ΣXiYiはいくらですか?
!!
解決しました!!
計算がめんどくさくて小数点以下を四捨五入していたのが失敗の元でした・・・。
自分の手抜きを棚に上げて式を疑うなんて何たる始末・・・
小数点以下の数値も大事なんですね。
tosshieさんのおかげで気付きました。ありがとうございました。
(ちなみにYmは18.75でなく18.075です)
やっとすっきりしたー!
回答者の皆さん、ありがとうございました!!
えーっと^^;
どこがおかしいか分からないので質問をしています。
何が欠けてるんですか???具体的に教えて下さい。