「Rによるやさしい統計学」について質問します。本を読んでいなくてもご回答いただけると思います。

p.271
# 有意水準5%の片側検定
>round(pbinom(wins,20,0.5),digit=4)     # wins=0:20
[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119
[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000
[21] 1.0000

本文中で「以上より棄却域は15勝以上(15回以上の成功)となります」とありますが,5%棄却域であるなら,1-0.05=0.95であり14勝以下(14回以下の成功)はこれに入る(0.9793)ので,棄却域は14勝以上(14回以上の成功)ではないでしょうか

回答の条件
  • 1人2回まで
  • 登録:2009/06/28 13:42:33
  • 終了:2009/06/30 01:36:02

ベストアンサー

id:doji No.2

doji回答回数201ベストアンサー獲得回数302009/06/29 02:47:18

ポイント200pt

当方Rは知りませんが、統計は軽く習ったことあります。

15勝以上であってると思います。

エクセルで計算してみたのがあるので、よろしければご覧下さい。(見なくても多分大丈夫です。)

あとグラフは致命的な間違いがあるので見なかったことにして下さい。すみません(汗)

http://www1.axfc.net/uploader/Sc/so/13062


[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

  20勝   19勝   18勝   17勝   16勝   15勝   14勝・・・(ずれてるかも・・)

こう見たら分かりやすいと思います。

これだと、15勝以上する確率は<0.05です。

20, 19, 18,,,と累積していくのと、0, 1, 2, 3,,,で累積していくのでなんかずれるのがパッと見、腑に落ちないとおもいますが。ちょっとトリックがあります。


有意水準95%というのは95%「以上」の確率でその事象が起きると言うことです。

この辺がややこしいところです。


式で書くと

0.95<(x勝以下の確率)

(変形すると0.05>1-(x勝以下の確率)=(x+1勝以上する確率))

この式が成り立つ最小のxが欲しいです。


①0.95>(13勝以下の確率)  これだと有意水準に達していません。

②0.95<(14勝以下の確率)  この時初めて有意水準に達します。


変形させると

①0.05>(14勝以上の確率)  これは5%以上でダメですよね。

②0.05<(15勝以上の確率)  5%以内です!


ここに誤解の元があるのではないでしょうか。


ちょっと再勉強しつつ書いたので何か変な書き方があるかもしれません。見逃してやって下さい。

id:moerrari

まさに解答そのものをいただきました。

エクセルの表の累積の部分を見て腑に落ちました。

( 0(,1,2,…)勝の下側確率=20(,19,18,…)勝の確率と見ていい、というところはトリックがあるとおっしゃる通り、まだ今ひとつ腑に落ちていませんが… )

ありがとうございました。

2009/06/30 01:34:04

その他の回答(1件)

id:nobnob3 No.1

考え中回答回数321ベストアンサー獲得回数292009/06/28 17:19:11

ポイント200pt

私はR初心者です。つい先日Rをインストールしたばかり(笑)。

一緒に勉強しましょう。


moerrariさんはご存知とは思いますが、まず、ここの式の意味を説明してみます。

>wins=0:20

winsという変数にRではベクトルと呼ばれる概念で0,1,...,20という数の集合を代入する。=の代わりに<-でもOKですね。

>round(x,digit=4)

ある値xを小数点以下4桁で四捨五入する(厳密には四捨五入ではなくIEEE式というのを使っているらしい)。

>pbinom(wins,20,0.5)

勝つ(二項分布)確率が0.5で、試行回数が20回の時、変数wins回以上勝つ場合の確率を1から引いた値。

>[1] [11]...

先頭の値が結果の何番目かを意味している。Rのコンソールの表示幅で結果は異なる。

実際に計算してみました。

> round(pbinom(0:20,20,0.5),digit=4)

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000


この式は、以下と同値    

> cumsum(round((choose(20,0:20)*(0.5)^20),digit=4))

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000

ちなみにcumsumは累積を計算

choose(n,x)は二項係数nCxと同値


さて問題に戻ると、

この問題は、次のように言い換えられるハズです。

勝率5割の試合を20回行なった場合、偶然の範囲では、最大何回まで勝つ事があり得るか?

(偶然の範囲を95%とする。)


で、以下の計算結果は、順に、0回以上勝つ確率=1-0.0000, 1回以上勝つ確率=1-0.0000を表しています。

これからすると、13回以上勝つ確率は、1-0.9423=0.0577, 14回以上勝つ確率は、1-0.9793=0.0207です。

(注意![1] は0回以上勝つ場合です。)

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000


13回以上の場合は、5.8%で、95%の範囲に入るので(棄却域5%未満にならないので)偶然の範囲で起こりうる。

ところが14回以上の場合には、2.1%で95%の範囲をはみ出すので(棄却率5%未満に入る)偶然では起こりえない。

ということだと思います。


pbinom(wins,20,0.5) この式の意味がわかりにくいですが、この式が与える値は、ベル型の分布があったとき、

x=winsよりも左側でベル型の下の面積を意味しています。図を見ると良く分かると思います。


他には、

> qbinom(0.05,20,0.5,lower=F)

[1] 14

> pbinom(14,20,0.5,lower=F)

[1] 0.02069473

こういう結果も上記結果を指示します。

以下Rマニュアルの158ページの図を見ると良く理解できると思います。

http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf

id:moerrari

丁寧なご回答をどうもありがとうございます。

全くの独学で頼る先もなく本当に助かります。

また疑問が出た際、お力をお借りできれば幸いです。


ということは、本文中にある「以上より棄却域は15勝以上(#15回以上の成功)となります」の記述は誤りであり、自分の考えの通り、棄却域は14勝以上(14回以上の成功)でOKかな?

と思いましたが、

> pbinom(14, 20, 0.5, lower=F)

[1] 0.02069473

を見てピンと来ました。

p.272によると、以下の記述で14勝以上の確率が求められるとあります。

> pbinom(13, 20, 0.5, lower=F)  # 13勝(13回成功)の上側確率=14勝(14回成功)以上の確率

[1] 0.05765915

同様に1-pbinom(13, 20 , 0.5)でも14勝以上の確率が求められるとあります。1-{13勝以下の確率(=0.9423)}={14勝以上の確率(=0.0577)}

よって「14勝以上」ではまだ棄却域に入らないのですね。

2009/06/29 01:56:06
id:doji No.2

doji回答回数201ベストアンサー獲得回数302009/06/29 02:47:18ここでベストアンサー

ポイント200pt

当方Rは知りませんが、統計は軽く習ったことあります。

15勝以上であってると思います。

エクセルで計算してみたのがあるので、よろしければご覧下さい。(見なくても多分大丈夫です。)

あとグラフは致命的な間違いがあるので見なかったことにして下さい。すみません(汗)

http://www1.axfc.net/uploader/Sc/so/13062


[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

  20勝   19勝   18勝   17勝   16勝   15勝   14勝・・・(ずれてるかも・・)

こう見たら分かりやすいと思います。

これだと、15勝以上する確率は<0.05です。

20, 19, 18,,,と累積していくのと、0, 1, 2, 3,,,で累積していくのでなんかずれるのがパッと見、腑に落ちないとおもいますが。ちょっとトリックがあります。


有意水準95%というのは95%「以上」の確率でその事象が起きると言うことです。

この辺がややこしいところです。


式で書くと

0.95<(x勝以下の確率)

(変形すると0.05>1-(x勝以下の確率)=(x+1勝以上する確率))

この式が成り立つ最小のxが欲しいです。


①0.95>(13勝以下の確率)  これだと有意水準に達していません。

②0.95<(14勝以下の確率)  この時初めて有意水準に達します。


変形させると

①0.05>(14勝以上の確率)  これは5%以上でダメですよね。

②0.05<(15勝以上の確率)  5%以内です!


ここに誤解の元があるのではないでしょうか。


ちょっと再勉強しつつ書いたので何か変な書き方があるかもしれません。見逃してやって下さい。

id:moerrari

まさに解答そのものをいただきました。

エクセルの表の累積の部分を見て腑に落ちました。

( 0(,1,2,…)勝の下側確率=20(,19,18,…)勝の確率と見ていい、というところはトリックがあるとおっしゃる通り、まだ今ひとつ腑に落ちていませんが… )

ありがとうございました。

2009/06/30 01:34:04
  • id:doji
    たくさんのポイント、いわし、ありがとうございます。お役に立てたようで良かったです。

    >( 0(,1,2,…)勝の下側確率=20(,19,18,…)勝の確率と見ていい、というところはトリックがあるとおっしゃる通り、まだ今ひとつ腑に落ちていませんが… )


    これは勝つのも負けるのも1/2の確率で起こるので、
    x勝する確率=x敗する確率(つまり20-x勝する確率のこと)
    というのが成り立つからです。なので端から足していっても=が成り立ちます。
    統計的というより直感的なものになりますね。1/2の場合のみの特殊な話です。


    あと、自分の回答で間違いがあるのでちょっとこちらに書きます。
    >有意水準95%というのは95%「以上」の確率でその事象が起きると言うことです。
    これは大間違いで正しくは
    >有意水準5%というのは5%「以下」の確率で~
    と書くべきでした。これを頭に入れておけば大丈夫だと思います。


    それも加えてちょっと追記します。自分の知識を人に説明できるようにしっかりさせる意味もあるので、適当に見流して下さい(笑)


    言葉として「15勝以上勝つのは(有意水準)5%で有意である」という風に言います。
    有意というのはそのままの意味で、「意味がある」=「普通に起こるような事じゃない」という事を表します。つまり「15勝以上勝ってしまうのは異常」っていうことなんですね。
    じゃあ残りの95%「まで」は普通??というのを、上の表を使って見てみたいと思います。
    13勝までの確率は0.9423、14勝までの確率は0.9793です。
    14勝は95%よりでかいじゃないかって言う感じなんですが、この時0.9423と0.95の間にあるのは14勝する場合の確率ですよね。
    0.95までは普通なのですから、14勝できたとしても普通に起きる範囲だって事になります。
    累積していって、0.95を超える最初の事象までは普通に起きる事!と思って大丈夫です。
  • id:moerrari
    >0.95までは普通なのですから、14勝できたとしても普通に起きる範囲だって事になります。
    上で一旦納得しましたが、良く考えたら当初の自分の疑問からずれていたわけですが、そこを拾っていただきありがとうございます。
    なるほどです、すっきりしました。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません