試行回数が分からなければどうにもなりません。
> [1] ソフト対人間でも、人間対人間でも、1回の対局は(互いに分散が等しい)正規分布をしたくじを、自分の壺から1つ引き、数が大きいほうが勝つようなものとする。もちろん壺は各自で異なり、強者ほど平均値の大きい壺を持っている。
このような大胆なモデルを設定しても、くじの数値自体を観測するわけではなく、観測するのはあくまで勝敗です。ですから、羽生が勝つのをコインで表が出ると解釈して、コインが表が出る確率が1/2と言えるかどうかを検定する問題とみるべきです。それだと、n回実験した場合は、両側検定であれば、
|勝率-1/2|>1.96√{(1/2)(1/2)/n}=0.98/√n
で有意水準5%で棄却です。
片側検定であれば、1.96でなく1.645にして片側に棄却域を設けますが、ただし注意しなければならないのは、結果を見てから片側検定を選んではいけません。
▽2
●
a-kuma3 ●100ポイント ベストアンサー |
計算できたっぽい
カードを引いてその大小で勝ち負けを決めるということは、カードの数字の差がゼロよりも大きい確率が勝つ確率ということになります。
独立した正規分布からの標本の差の分布は、平均が 、分散が の正規分布に従う、を使います。
http://lbm.ab.a.u-tokyo.ac.jp/~omori/meiji2/sec4/sec4.html
強豪ソフト と千田 の差の分布、
は、分散が同じなので、こうなります。
千田が強豪ソフトに勝つ確率が 7% ということは、確率分布で 0 以下が 7% ということです。
標準正規分布表を持ち出します。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
表で 43% のところは Z = 1.475 くらいです。
なので、以下となります。
同様に、羽生 と千田 の差の分布、
では、表から 40% は Z = 1.280 くらいです。
先と同様に、
問題の、強豪ソフト と羽生 の差の分布を考えます。
先の式から、
標準正規分布表から Z = 0.17678 のときは、面積が 0.0701 くらいです。
つまり、0 以上になる確率が 57% 、つまり強豪ソフトが勝つ確率が 57% ということです。
後は、これが有意な差かどうかを検定します。
適合度検定を使います。
先に求めた強豪ソフトと羽生の勝率通りに対戦結果 57 : 43 が得られたとして、勝ち負けがどっこいどっこいの 50 : 50 と有意な差があるかどうか、です。
統計検定の説明は端折ります。
http://next1.msi.sk.shibaura-it.ac.jp/MULTIMEDIA/statistics/node21.html
:強豪ソフトと羽生の勝率は等しい
有意水準:
統計量:
カイ二乗分布表 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/chi2disttab.html より
よって帰無仮説は棄却できず、 を容認。
つまり、強豪ソフトと羽生の勝ち負けには有意な差はない、ということになります。
class CompX_Habu_Simulator def initialize @random = Random.new end def win_one_play? @random.rand <= 0.57 end def win_one_title? n cond = n / 2.0 win = 0 lose = 0 n.times { if win_one_play? then win += 1 else lose += 1 end break if win > cond or lose > cond } win > cond end def win_one_year? win = 0 4.times { win += 1 if win_one_title? 7 } 3.times { win += 1 if win_one_title? 5 } win >= 4 end def try number n = 0 win = 0 number.times { n += 1 win += 1 if win_one_year? } puts "#{win} / #{n} --- #{win / (n * 1.0)}" end end s = CompX_Habu_Simulator.new 5.times { s.try 50000 }
七タイトル戦のうち、七番勝負が四回、五番勝負が三回です。
対戦の勝率 57% で、七タイトルのうち何勝取ったかをカウントします。
50,000回の試行を 5回繰り返しました。
# 4勝以上 39356 / 50000 --- 0.78712 39438 / 50000 --- 0.78876 39222 / 50000 --- 0.78444 39307 / 50000 --- 0.78614 39214 / 50000 --- 0.78428 # 5勝以上 25781 / 50000 --- 0.51562 25670 / 50000 --- 0.5134 25571 / 50000 --- 0.51142 25606 / 50000 --- 0.51212 25803 / 50000 --- 0.51606 # 6勝以上 10857 / 50000 --- 0.21714 10971 / 50000 --- 0.21942 10974 / 50000 --- 0.21948 10844 / 50000 --- 0.21688 10955 / 50000 --- 0.2191
勝ち越すかどうかでいうと、勝ち越す確率は 78?79% くらい。
圧倒的と言える 1回取りこぼすかどうかという確率は、22% くらいです。
まあ、試行回数が多くなるとこうなります。
ちょっと視点を変えて、一生の間にこの対戦をするのは多くても6回くらいだろう、と想定して、延べ6年 年に7回のタイトル戦を戦って強豪ソフトX が獲得したタイトルの数の度数分布を取ってみました。
タイトル数 | 度数 |
---|---|
0 | 0 |
1 | 0 |
2 | 24 |
3 | 93 |
4 | 263 |
5 | 387 |
6 | 233 |
グラフにすると、こんな感じ。
6年の対戦で、タイトルを多くとった年が 4年以下が 38% の確率。
観戦する立場でいうと、サンプリングは一回だけですから、どっこいどっこいか 6年のうち 2年はタイトル数が負けているのが 5回に2回くらいの確率であります。
強豪ソフトX が圧倒的に強いというには、微妙なところです。