おそらくはとても簡単なことだと思いますが、呆れずにご教授下さい。。
母集団{25,27,28,29,36,39,42,43,54,68 }
(平均39.1)
これについて、
①分散=166.09、標準偏差=12.88759で間違いないですか?
②正規分布はどうすれば出せますか?
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/normal.html
↑これに載ってるような釣鐘型の図の出し方も教えて下さい。
③以下のことを確認するにはどうすれば良いですか。
平均±標準偏差が全体の68%になるかどうか
平均±標準偏差×2が95%になるかどうか
平均±標準偏差×3が99.7%になるかどうか
取り急ぎ、お願いします。
今までの回答された方と同じですが。。。。。
##
1つめの質問
あなたの計算結果は正しいと思われます。私の得られた以下の計算結果とほぼ等しいです。
#
分散=166.09
標準偏差=12.887590930814
#
下記で記載している計算方法で求めました。
注意する点は、問題文には「母集団」と記述されている点です。
多くのパソコンの計量ソフトはデータを「母集団」ではなく、
「母集団の標本」と前提していますので、単純に関数で計算すると違った結果がでます。
#
**計算方法**
①母集団の各データ{25,27,28,29,36,39,42,43,54,68 }と平均値(39.1)との差をそれぞれ求める。
(-14.1,-12.1,-11.1,-10.1,-3.1,-0.1,2.9,3.9,14.9,28.9)
②先ほど求めた値を全て足し合わせる。(総和を求める)
(1660.9)
③最後に先ほど求めた値(1660.9)にデータ数である10を除する(割り算する)と、分散が得られます。
(166.09)
④分散を平方すると、標準偏差が得られます。
(12.887590930814)
#
たとえば、表計算ソフトのExcelは、単純にvar関数などで分散を求めると、
計算方法③の割り算の分母が、データ数ではなく、データ数×(データ数-1)となります。
ちなみに、Excel関数で求めると以下になります。
#
分散=184.5444444
標準偏差=13.58471363
(これは母集団を標本とした場合であり、正規の答えではありません)
##
2つめの質問
統計ソフト(sas,spss,R等)があればすぐにできますが、表計算ソフトExcelでの方法(実はこちらのほうがヤヤコシイ)の1例を記述いたします。
作図方法の③がキーです。大変ですががんばって下さい。
#
**正規分布の作図方法**
①平均の値と標準偏差の値をそれぞれシートに記述する。
②グラフの横軸となる値をシートに縦に記述する。
(*正規分布(標準偏差12.887590930814、平均39.1)の場合、-10から90位までを、0.5刻みに200個、縦のシートに作ると(方法は最初のシートに-10を記述し、
次のシート以降は(=上のシート+0.5)と計算させます)、綺麗に描きます。)
③横軸になるシート(②で作ったもの)の全ての隣のシートに(=normdist(②のシートを指定,平均の値のあるシートを指定,標準偏差のあるシートを指定,false)と記述します。
(*例:=NORMDIST(A3,$B$1,$B$2,FALSE)、但し、$の印はこの式を他のシートへコピーした場合でも固定するためのもの(F4キーがショートカットキー)もしくは=NORMDIST(A3,39.1,12.887590930814,FALSE))
④3番目の式で得られた数値の全てをマウスで選択し、グラフを滑らかにみせるために「散布図」の平滑線で描かれたものをでグラフを描く。
##
3つめの質問
以下で説明しますが、http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0....もわかりやすいです。
(時間が無かったり、説明が面倒な場合、⑤から参照してください。即回答が欲しい場合、⑬を参照してください)
#
この問題は今までの問題と異なり、回答者に「推定」や「検定」などに展開する前の基本統計の理解を問う問題と思われます。
まず、問題の意味(何を問われているのか)を意識することが、この先の統計の問題での理解の一番の近道だと思います。
(ここでは、母集団が明示されていますが、ほとんどの現実では、データの数が多すぎて1部のサンプルしかわからない合があります。
その場合、そのサンプルでわかる基本等計量(平均値など)は、あくまで予測であり真実であるかどうか確実にはわかりません。
そこで、統計的に何%、正しいといえる基準が必要です(この表現は帰無仮説などでは正確ではありませんが、今回の主旨でないので省きます)。
それがこの問題に出てくる”~%”の意味に繫がります。
#
①まず正規分布のグラフを見てください。このグラフの重要なポイントは曲線で描かれた線から、横軸の線までの間にある面積です。
②この面積が、後にでてくる「推定」などで、平均値を推定する場合の統計的に示す確からしさ、
信頼区間というもの(確率という名前ではありません。)を示すものであります。
③信頼区間は横軸をどこからどこまでとるかできまります。横軸の幅はグラフをみるとイメージが付きますが、
平均値からどれだけ離れているかで、決めます。問題にもあるように、平均値±標準偏差(実はこれを1シグマといいます。)、
平均値±標準偏差×2(同様に2シグマ)などというのが、面積を決める横軸の幅です。
③従って、信頼区間の値(~%)は、横軸の値をどこからどこまで取るかで変化します。
また、グラフの一番端からある地点までの面積を”裾(すそ)”とよび、信頼区間以外にある左右の部分のことを両裾、
ある地点からグラフの右側の端までの面積を右裾、左なら左裾といいます。
④信頼区間の値に対応する横軸の値を調べるためには、一般的に標準正規分布表を用います。これは、統計の教科書の最後にあると思います。
#
***ここから問題を”平均±標準偏差が全体の68%になるかどうか”を例に具体的に解きます。***
#
⑤標準正規分布表を見てください。(参照:http://www.interq.or.jp/snake/totugeki/HSB.htm)多分教科書にもあると思います。
これは、表の中が標準正規分布の片側のすそ(上を参照)を示し、縦軸には対応する、標準正規分布グラフの横軸の値の小数点1桁までを、
横軸には、標準正規分布グラフの横軸の値の小数点1桁以降の値を示しています。
(表によっては、右すそを前提にしたものや、左すそ、両裾を前提にしたものがあります。どれも一緒なのですが気を付けて下さい)
⑥全体が68%なので、残りは100-68=32(%)より、右裾(左裾)、32/2=16(%)となり、表にある.16に近いものを探します。
⑦表では.16はないが、.1611など、近いものをがあるのでそれを参照すると、縦軸が0.9、横軸が.009なので、標準正規分布の横軸の値が0.99のときに
右裾が16%となり、全体が68%にほぼ一致することが理解できます。
⑧0.99を横軸の値と呼んだが、これは、先ほどの標準正規分布での平均値(0)から0.99だけ離れていることをほぼ表しており、
平均値(0)±0.99×標準偏差(1)=0.99(-0.99)ということを意味します。
⑨従って、平均0、標準偏差1の標準正規分布以外のケースでも、平均値±0.99×標準偏差の範囲ではほぼ68%となります。
⑩今回のケースは平均±標準偏差、即ち平均±1×標準偏差となるの で、平均±標準偏差が全体のほぼ68%であるといえますが、正確 ではありません。従って、この表を今回の方法と逆の見方をしてみてください。
⑪縦軸が1.0、横軸が.00に対応する標準正規分布の値は.1587、これは片側の裾を表しており、0.1587×2=0.3174であり、1-0.3174=0.6826となり、
正確には全体の68.26%を示していることがわかります。
⑫したがって、平均±標準偏差は全体の68.26%であり、68%にはならない(但し、四捨五入すれば、68%となります)。というのが解です。
#
同じ要領で他も求めると、
”平均±標準偏差×2が95%になるかどうか”は、
平均±標準偏差×2は95.44%であり、95%にはならない(但し、四捨五入すれば、95%となります)
”平均±標準偏差×3が99.7%になるかどうか”は、
平均±標準偏差×3は99.7%となる。
#
以下のExcelによる計算は、あくまで理屈を理解した上で使ってみて下さい。
#
⑬”平均±標準偏差が全体の68%になるかどうか”は、シートに=(1-(1-NORMSDIST(1))*2)*100と入力すれば、68.2689492137086が得られます。
したがって、平均±標準偏差は全体の68.2689492137086%であり、68%にはならない(但し、四捨五入すれば、68%となります)。というのが解です。
#
同じように、”平均±標準偏差×2が全体の95%になるかどうか”は、シートに=(1-(1-NORMSDIST(2))*2)*100と入力すれば、95.44997361が得られます。
したがって、平均±標準偏差×2は全体の95.44997361%であり、95%にはならない(但し、四捨五入すれば、95%となります)。というのが解です。
#
同じように、”平均±標準偏差×3が全体の99.7%になるかどうか”は、シートに=(1-(1-NORMSDIST(3))*2)*100と入力すれば、99.73002039が得られます。
したがって、平均±標準偏差×2は全体の99.73002039%であり、99.7%にはならない(但し、四捨五入すれば、95%となります)。というのが解です。
(上記の正規分布表を用いた方法では小数点以下1までしか求められない為、結果が異なります。)
質問1について
ExcelのSTDEV(標準偏差を求める関数)を使ったら
標準偏差 13.58471363
分散=(標準偏差)^2=184.5444444
となりました。。
質問2について
URLのなかの正規分布の式に
平均と標準偏差を代入してあげてプロットしたら出来ると思います。そのさい、ExcelのNORMDIST関数を使ったら簡単に出来ると思います。。
質問3について
XがN(μ,σ^2)に従う(μは平均,σは標準偏差)とき,
Z=(X-μ)/σは標準正規分布に従い
P(x1≦X≦x2)=P{(x1-μ)/σ≦Z≦(x2-μ)/σ}
となります.
μとσに値を代入すると結果はP(-1≦Z≦1)となり
これは正規分布表より0.6826.....となり
おおよそ,68%であるといえます。
同様な計算を行っていただければ,
P{-2≦Z≦2}=0.9544
P{-3≦Z≦3}=0.9973
という結果が得られるはずです。
わかりづらくてすみません。
回答ありがとうございます。
すみませんが、正規分布の出し方がまだ分かりません。。
NORMDIST(x,平均,標準偏差,関数形式) の
xと関数形式に何を入れれば良いか分からないので教えて下さい。
回答回数の設定を変更しましたのでよろしくお願いします。
NORMDIST関数について補足します。
(専門家ではないので、用語に舌足らずな点があることはご容赦ください)
まず、xに代入するのは、出現頻度を知りたい「特定の数値」です。
また、関数形式はTRUEまたはFALSEで指定します。
TRUEだと累積密度、FALSEだと確率密度になります。
ご質問の趣旨からするとFALSEにしておくべきかと思います。
例えば、平均50、標準偏差10の正規分布において
「60」という値の出現頻度を知りたいときは
=NORMDIST(60,50,10,FALSE)
と入力します。(=0.024197072)
厳密な釣鐘状のカーブをどう描くのかはわかりませんが、
釣鐘状に近似するヒストグラムの描き方について以下に一例を記します。
ExcelでA1に1、A2に2・・・A100に100を入力します。
B1には =NORMDIST(A1,50,10,FALSE) と入力します。(50、10のかわりに任意の平均と標準偏差を入れてください)
B1のセルをドラッグしてB100まで広げます。
B1からB100に表示された数値をグラフ化します。
すると正規分布(に近いヒストグラム)が出現します。
専門家の方、補足していただけると助かります。
標準正規分布なら
A列に入れる値の範囲を-3~+3位にして,
刻みを細かく(0.05)位にすれば釣鐘状のグラフがかけます。
A1に-3を入力
A2に=A1+0.05を入力
A2をコピーしてA3以降にペースト
#多分A121が+3
B列は上の回答の通りにしてください。
グラフは散布図でよいと思います。
今までの回答された方と同じですが。。。。。
##
1つめの質問
あなたの計算結果は正しいと思われます。私の得られた以下の計算結果とほぼ等しいです。
#
分散=166.09
標準偏差=12.887590930814
#
下記で記載している計算方法で求めました。
注意する点は、問題文には「母集団」と記述されている点です。
多くのパソコンの計量ソフトはデータを「母集団」ではなく、
「母集団の標本」と前提していますので、単純に関数で計算すると違った結果がでます。
#
**計算方法**
①母集団の各データ{25,27,28,29,36,39,42,43,54,68 }と平均値(39.1)との差をそれぞれ求める。
(-14.1,-12.1,-11.1,-10.1,-3.1,-0.1,2.9,3.9,14.9,28.9)
②先ほど求めた値を全て足し合わせる。(総和を求める)
(1660.9)
③最後に先ほど求めた値(1660.9)にデータ数である10を除する(割り算する)と、分散が得られます。
(166.09)
④分散を平方すると、標準偏差が得られます。
(12.887590930814)
#
たとえば、表計算ソフトのExcelは、単純にvar関数などで分散を求めると、
計算方法③の割り算の分母が、データ数ではなく、データ数×(データ数-1)となります。
ちなみに、Excel関数で求めると以下になります。
#
分散=184.5444444
標準偏差=13.58471363
(これは母集団を標本とした場合であり、正規の答えではありません)
##
2つめの質問
統計ソフト(sas,spss,R等)があればすぐにできますが、表計算ソフトExcelでの方法(実はこちらのほうがヤヤコシイ)の1例を記述いたします。
作図方法の③がキーです。大変ですががんばって下さい。
#
**正規分布の作図方法**
①平均の値と標準偏差の値をそれぞれシートに記述する。
②グラフの横軸となる値をシートに縦に記述する。
(*正規分布(標準偏差12.887590930814、平均39.1)の場合、-10から90位までを、0.5刻みに200個、縦のシートに作ると(方法は最初のシートに-10を記述し、
次のシート以降は(=上のシート+0.5)と計算させます)、綺麗に描きます。)
③横軸になるシート(②で作ったもの)の全ての隣のシートに(=normdist(②のシートを指定,平均の値のあるシートを指定,標準偏差のあるシートを指定,false)と記述します。
(*例:=NORMDIST(A3,$B$1,$B$2,FALSE)、但し、$の印はこの式を他のシートへコピーした場合でも固定するためのもの(F4キーがショートカットキー)もしくは=NORMDIST(A3,39.1,12.887590930814,FALSE))
④3番目の式で得られた数値の全てをマウスで選択し、グラフを滑らかにみせるために「散布図」の平滑線で描かれたものをでグラフを描く。
##
3つめの質問
以下で説明しますが、http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0....もわかりやすいです。
(時間が無かったり、説明が面倒な場合、⑤から参照してください。即回答が欲しい場合、⑬を参照してください)
#
この問題は今までの問題と異なり、回答者に「推定」や「検定」などに展開する前の基本統計の理解を問う問題と思われます。
まず、問題の意味(何を問われているのか)を意識することが、この先の統計の問題での理解の一番の近道だと思います。
(ここでは、母集団が明示されていますが、ほとんどの現実では、データの数が多すぎて1部のサンプルしかわからない合があります。
その場合、そのサンプルでわかる基本等計量(平均値など)は、あくまで予測であり真実であるかどうか確実にはわかりません。
そこで、統計的に何%、正しいといえる基準が必要です(この表現は帰無仮説などでは正確ではありませんが、今回の主旨でないので省きます)。
それがこの問題に出てくる”~%”の意味に繫がります。
#
①まず正規分布のグラフを見てください。このグラフの重要なポイントは曲線で描かれた線から、横軸の線までの間にある面積です。
②この面積が、後にでてくる「推定」などで、平均値を推定する場合の統計的に示す確からしさ、
信頼区間というもの(確率という名前ではありません。)を示すものであります。
③信頼区間は横軸をどこからどこまでとるかできまります。横軸の幅はグラフをみるとイメージが付きますが、
平均値からどれだけ離れているかで、決めます。問題にもあるように、平均値±標準偏差(実はこれを1シグマといいます。)、
平均値±標準偏差×2(同様に2シグマ)などというのが、面積を決める横軸の幅です。
③従って、信頼区間の値(~%)は、横軸の値をどこからどこまで取るかで変化します。
また、グラフの一番端からある地点までの面積を”裾(すそ)”とよび、信頼区間以外にある左右の部分のことを両裾、
ある地点からグラフの右側の端までの面積を右裾、左なら左裾といいます。
④信頼区間の値に対応する横軸の値を調べるためには、一般的に標準正規分布表を用います。これは、統計の教科書の最後にあると思います。
#
***ここから問題を”平均±標準偏差が全体の68%になるかどうか”を例に具体的に解きます。***
#
⑤標準正規分布表を見てください。(参照:http://www.interq.or.jp/snake/totugeki/HSB.htm)多分教科書にもあると思います。
これは、表の中が標準正規分布の片側のすそ(上を参照)を示し、縦軸には対応する、標準正規分布グラフの横軸の値の小数点1桁までを、
横軸には、標準正規分布グラフの横軸の値の小数点1桁以降の値を示しています。
(表によっては、右すそを前提にしたものや、左すそ、両裾を前提にしたものがあります。どれも一緒なのですが気を付けて下さい)
⑥全体が68%なので、残りは100-68=32(%)より、右裾(左裾)、32/2=16(%)となり、表にある.16に近いものを探します。
⑦表では.16はないが、.1611など、近いものをがあるのでそれを参照すると、縦軸が0.9、横軸が.009なので、標準正規分布の横軸の値が0.99のときに
右裾が16%となり、全体が68%にほぼ一致することが理解できます。
⑧0.99を横軸の値と呼んだが、これは、先ほどの標準正規分布での平均値(0)から0.99だけ離れていることをほぼ表しており、
平均値(0)±0.99×標準偏差(1)=0.99(-0.99)ということを意味します。
⑨従って、平均0、標準偏差1の標準正規分布以外のケースでも、平均値±0.99×標準偏差の範囲ではほぼ68%となります。
⑩今回のケースは平均±標準偏差、即ち平均±1×標準偏差となるの で、平均±標準偏差が全体のほぼ68%であるといえますが、正確 ではありません。従って、この表を今回の方法と逆の見方をしてみてください。
⑪縦軸が1.0、横軸が.00に対応する標準正規分布の値は.1587、これは片側の裾を表しており、0.1587×2=0.3174であり、1-0.3174=0.6826となり、
正確には全体の68.26%を示していることがわかります。
⑫したがって、平均±標準偏差は全体の68.26%であり、68%にはならない(但し、四捨五入すれば、68%となります)。というのが解です。
#
同じ要領で他も求めると、
”平均±標準偏差×2が95%になるかどうか”は、
平均±標準偏差×2は95.44%であり、95%にはならない(但し、四捨五入すれば、95%となります)
”平均±標準偏差×3が99.7%になるかどうか”は、
平均±標準偏差×3は99.7%となる。
#
以下のExcelによる計算は、あくまで理屈を理解した上で使ってみて下さい。
#
⑬”平均±標準偏差が全体の68%になるかどうか”は、シートに=(1-(1-NORMSDIST(1))*2)*100と入力すれば、68.2689492137086が得られます。
したがって、平均±標準偏差は全体の68.2689492137086%であり、68%にはならない(但し、四捨五入すれば、68%となります)。というのが解です。
#
同じように、”平均±標準偏差×2が全体の95%になるかどうか”は、シートに=(1-(1-NORMSDIST(2))*2)*100と入力すれば、95.44997361が得られます。
したがって、平均±標準偏差×2は全体の95.44997361%であり、95%にはならない(但し、四捨五入すれば、95%となります)。というのが解です。
#
同じように、”平均±標準偏差×3が全体の99.7%になるかどうか”は、シートに=(1-(1-NORMSDIST(3))*2)*100と入力すれば、99.73002039が得られます。
したがって、平均±標準偏差×2は全体の99.73002039%であり、99.7%にはならない(但し、四捨五入すれば、95%となります)。というのが解です。
(上記の正規分布表を用いた方法では小数点以下1までしか求められない為、結果が異なります。)
こちらの意図を汲んだ丁寧な回答を頂いて感謝しております。
時間的余裕がないためひとりひとりにコメントを返信できなくて申し訳ありません。
こちらの意図を汲んだ丁寧な回答を頂いて感謝しております。
時間的余裕がないためひとりひとりにコメントを返信できなくて申し訳ありません。