人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

「Rによるやさしい統計学」について質問します。本を読んでいなくてもご回答いただけると思います。
p.271
# 有意水準5%の片側検定
>round(pbinom(wins,20,0.5),digit=4) # wins=0:20
[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119
[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000
[21] 1.0000

本文中で「以上より棄却域は15勝以上(15回以上の成功)となります」とありますが,5%棄却域であるなら,1-0.05=0.95であり14勝以下(14回以下の成功)はこれに入る(0.9793)ので,棄却域は14勝以上(14回以上の成功)ではないでしょうか


●質問者: moerrari
●カテゴリ:コンピュータ 書籍・音楽・映画
✍キーワード:WINS 棄却 統計学
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● 考え中
●200ポイント

私はR初心者です。つい先日Rをインストールしたばかり(笑)。

一緒に勉強しましょう。


moerrariさんはご存知とは思いますが、まず、ここの式の意味を説明してみます。

>wins=0:20

winsという変数にRではベクトルと呼ばれる概念で0,1,...,20という数の集合を代入する。=の代わりに<-でもOKですね。

>round(x,digit=4)

ある値xを小数点以下4桁で四捨五入する(厳密には四捨五入ではなくIEEE式というのを使っているらしい)。

>pbinom(wins,20,0.5)

勝つ(二項分布)確率が0.5で、試行回数が20回の時、変数wins回以上勝つ場合の確率を1から引いた値。

>[1] [11]...

先頭の値が結果の何番目かを意味している。Rのコンソールの表示幅で結果は異なる。

実際に計算してみました。

> round(pbinom(0:20,20,0.5),digit=4)

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000


この式は、以下と同値

> cumsum(round((choose(20,0:20)*(0.5)^20),digit=4))

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000

ちなみにcumsumは累積を計算

choose(n,x)は二項係数nCxと同値


さて問題に戻ると、

この問題は、次のように言い換えられるハズです。

勝率5割の試合を20回行なった場合、偶然の範囲では、最大何回まで勝つ事があり得るか?

(偶然の範囲を95%とする。)


で、以下の計算結果は、順に、0回以上勝つ確率=1-0.0000, 1回以上勝つ確率=1-0.0000を表しています。

これからすると、13回以上勝つ確率は、1-0.9423=0.0577, 14回以上勝つ確率は、1-0.9793=0.0207です。

(注意![1] は0回以上勝つ場合です。)

[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

[11] 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998 1.0000 1.0000

[21] 1.0000


13回以上の場合は、5.8%で、95%の範囲に入るので(棄却域5%未満にならないので)偶然の範囲で起こりうる。

ところが14回以上の場合には、2.1%で95%の範囲をはみ出すので(棄却率5%未満に入る)偶然では起こりえない。

ということだと思います。


pbinom(wins,20,0.5) この式の意味がわかりにくいですが、この式が与える値は、ベル型の分布があったとき、

x=winsよりも左側でベル型の下の面積を意味しています。図を見ると良く分かると思います。


他には、

> qbinom(0.05,20,0.5,lower=F)

[1] 14

> pbinom(14,20,0.5,lower=F)

[1] 0.02069473

こういう結果も上記結果を指示します。

以下Rマニュアルの158ページの図を見ると良く理解できると思います。

http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf

◎質問者からの返答

丁寧なご回答をどうもありがとうございます。

全くの独学で頼る先もなく本当に助かります。

また疑問が出た際、お力をお借りできれば幸いです。


ということは、本文中にある「以上より棄却域は15勝以上(#15回以上の成功)となります」の記述は誤りであり、自分の考えの通り、棄却域は14勝以上(14回以上の成功)でOKかな?

と思いましたが、

> pbinom(14, 20, 0.5, lower=F)

[1] 0.02069473

を見てピンと来ました。

p.272によると、以下の記述で14勝以上の確率が求められるとあります。

> pbinom(13, 20, 0.5, lower=F) # 13勝(13回成功)の上側確率=14勝(14回成功)以上の確率

[1] 0.05765915

同様に1-pbinom(13, 20 , 0.5)でも14勝以上の確率が求められるとあります。1-{13勝以下の確率(=0.9423)}={14勝以上の確率(=0.0577)}

よって「14勝以上」ではまだ棄却域に入らないのですね。


2 ● doji
●200ポイント ベストアンサー

当方Rは知りませんが、統計は軽く習ったことあります。

15勝以上であってると思います。

エクセルで計算してみたのがあるので、よろしければご覧下さい。(見なくても多分大丈夫です。)

あとグラフは致命的な間違いがあるので見なかったことにして下さい。すみません(汗)

http://www1.axfc.net/uploader/Sc/so/13062


[1] 0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119

20勝 19勝 18勝 17勝 16勝 15勝 14勝・・・(ずれてるかも・・)

こう見たら分かりやすいと思います。

これだと、15勝以上する確率は<0.05です。

20, 19, 18,,,と累積していくのと、0, 1, 2, 3,,,で累積していくのでなんかずれるのがパッと見、腑に落ちないとおもいますが。ちょっとトリックがあります。


有意水準95%というのは95%「以上」の確率でその事象が起きると言うことです。

この辺がややこしいところです。


式で書くと

0.95<(x勝以下の確率)

(変形すると0.05>1-(x勝以下の確率)=(x+1勝以上する確率))

この式が成り立つ最小のxが欲しいです。


?0.95>(13勝以下の確率) これだと有意水準に達していません。

?0.95<(14勝以下の確率) この時初めて有意水準に達します。


変形させると

?0.05>(14勝以上の確率) これは5%以上でダメですよね。

?0.05<(15勝以上の確率) 5%以内です!


ここに誤解の元があるのではないでしょうか。


ちょっと再勉強しつつ書いたので何か変な書き方があるかもしれません。見逃してやって下さい。

◎質問者からの返答

まさに解答そのものをいただきました。

エクセルの表の累積の部分を見て腑に落ちました。

( 0(,1,2,…)勝の下側確率=20(,19,18,…)勝の確率と見ていい、というところはトリックがあるとおっしゃる通り、まだ今ひとつ腑に落ちていませんが… )

ありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ