【統計の問題･将棋ｿﾌﾄは羽生より強い？】｢将棋のﾌﾟﾛ棋士は将棋ｿﾌﾄに勝てない？情報処理学会が勝利を宣言｣ http://matome.naver.jp/odai/2144461135407442101?pa…

【統計の問題･将棋ｿﾌﾄは羽生より強い？】

｢将棋のﾌﾟﾛ棋士は将棋ｿﾌﾄに勝てない？情報処理学会が勝利を宣言｣
http://matome.naver.jp/odai/2144461135407442101?page=2
に､以下のような記述がありました｡

｢現役ﾌﾟﾛで最も将棋ｿﾌﾄに詳しいといわれる千田翔太でさえ､特別な対策をせずに電王戦に出場するような強豪ｿﾌﾄと真っ向から戦った場合で『勝率は7ﾊﾟｰｾﾝﾄ』｣

｢羽生善治らﾄｯﾌﾟ棋士でも千田を相手に90ﾊﾟｰｾﾝﾄ以上勝つことは難しいため､『ｿﾌﾄは既に人間を超えている』との推論が出てもおかしくない｣

そこで統計の問題｡

[1] ｿﾌﾄ対人間でも､人間対人間でも､1回の対局は(互いに分散が等しい)正規分布をしたくじを､自分の壺から1つ引き､数が大きいほうが勝つようなものとする｡もちろん壺は各自で異なり､強者ほど平均値の大きい壺を持っている｡

[2] [1]のﾙｰﾙで多数回の試行を行ったところ､千田のｿﾌﾄXへの勝率は7%で､羽生の千田への勝率は90%だった

という前提から､｢ｿﾌﾄXが羽生より有意に強い｣と言えるか､ざっくりとした計算経過とともに答えてください｡
よろしくお願いいたします｡

計算できたっぽい

ｶｰﾄﾞを引いてその大小で勝ち負けを決めるということは､ｶｰﾄﾞの数字の差がｾﾞﾛよりも大きい確率が勝つ確率ということになります｡

独立した正規分布からの標本の差の分布は､平均が $￥mu_1-￥mu_2$ ､分散が ${￥sigma_1}^2+{￥sigma_2}^2$ の正規分布に従う､を使います｡
http://lbm.ab.a.u-tokyo.ac.jp/~omori/meiji2/sec4/sec4.html

強豪ｿﾌﾄ $X_x$ と千田 $X_c$ の差の分布､
$X_x - X_c ￥sim N ( ￥mu_x-￥mu_c ￥hspace{5}, ￥hspace{5}{￥sigma_x}^2+{￥sigma_c}^2 )$
は､分散が同じなので､こうなります｡
$X_x - X_c ￥sim N ( ￥mu_x-￥mu_c ￥hspace{5}, ￥hspace{5}{2 ￥sigma}^2 )$

千田が強豪ｿﾌﾄに勝つ確率が 7% ということは､確率分布で 0 以下が 7% ということです｡

標準正規分布表を持ち出します｡
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

表で 43% のところは Z = 1.475 くらいです｡
なので､以下となります｡
$￥mu_x-￥mu_c ￥hspace{5} = ￥hspace{5} 1.475 ￥sqrt{2} ￥sigma$

同様に､羽生 $X_h$ と千田 $X_c$ の差の分布､
$X_h - X_c ￥sim N ( ￥mu_h-￥mu_c ￥hspace{5}, ￥hspace{5}{2 ￥sigma}^2 )$
では､表から 40% は Z = 1.280 くらいです｡
先と同様に､
$￥mu_h-￥mu_c ￥hspace{5} = ￥hspace{5} 1.280 ￥sqrt{2} ￥sigma$

問題の､強豪ｿﾌﾄ $X_x$ と羽生 $X_h$ の差の分布を考えます｡
$X_x - X_h ￥sim N ( ￥mu_x-￥mu_h ￥hspace{5}, ￥hspace{5}{2 ￥sigma}^2 )$

先の式から､
$￥mu_x-￥mu_h$
$= ￥mu_c + ￥hspace{5} 1.475 ￥sqrt{2} ￥sigma - (￥mu_c + ￥hspace{5} 1.280 ￥sqrt{2} ￥sigma )$
$= ￥hspace{5} 1.475 ￥sqrt{2} ￥sigma - ￥hspace{5} 1.280 ￥sqrt{2} ￥sigma$
$= ￥hspace{5} 0.125 ￥sqrt{2} ￥sigma$
$= ￥hspace{5} 0.17678 ￥sigma$

標準正規分布表から Z = 0.17678 のときは､面積が 0.0701 くらいです｡
つまり､0 以上になる確率が 57% ､つまり強豪ｿﾌﾄが勝つ確率が 57% ということです｡

後は､これが有意な差かどうかを検定します｡

適合度検定を使います｡
先に求めた強豪ｿﾌﾄと羽生の勝率通りに対戦結果 57 : 43 が得られたとして､勝ち負けがどっこいどっこいの 50 : 50 と有意な差があるかどうか､です｡

統計検定の説明は端折ります｡
http://next1.msi.sk.shibaura-it.ac.jp/MULTIMEDIA/statistics/node21.html

$H_0$ ：強豪ｿﾌﾄと羽生の勝率は等しい
有意水準： $￥alpha = 0.05$
統計量：
$￥chi_0^2 = ￥frac{57^2}{50} + ￥frac{43^2}{50} - 100$
$￥hspace{20}= 1.96$

ｶｲ二乗分布表 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/chi2disttab.html より
$￥chi_{0.05,2-1}^2 = 3.8416$

よって帰無仮説は棄却できず､ $H_0$ を容認｡
つまり､強豪ｿﾌﾄと羽生の勝ち負けには有意な差はない､ということになります｡

追記です｡

お話しの結末が気に入らない方がいらっしゃるようなので､別の結末を｡

確率分布関数が手に入っているので､回数を繰り返せば強豪ｿﾌﾄX が平均的に勝っちゃうというのは分かってます｡
では､無類の勝率を誇るかどうか､という話｡

将棋のﾀｲﾄﾙ戦は､年7回｡
その7回全てに､決勝の番手勝負に羽生と強豪ｿﾌﾄが勝ち残ったとして､7回のﾀｲﾄﾙ戦を勝ち越すことができる確率を求めてみます｡

計算でも行けそうな気もしますが､ﾌﾟﾛｸﾞﾗﾑでやってみました｡

class CompX_Habu_Simulator

 def initialize
 @random = Random.new
 end

 def win_one_play?
 @random.rand <= 0.57
 end

 def win_one_title? n
 cond = n / 2.0
 win = 0
 lose = 0
 n.times {
 if win_one_play? then
 win += 1
 else
 lose += 1
 end
 break if win > cond or lose > cond
 }
 win > cond
 end

 def win_one_year?
 win = 0
 4.times {
 win += 1 if win_one_title? 7
 }
 3.times {
 win += 1 if win_one_title? 5
 }
 win >= 4
 end

 def try number
 n = 0
 win = 0
 number.times {
 n += 1
 win += 1 if win_one_year?
 }
 puts "#{win} / #{n} --- #{win / (n * 1.0)}"
 end

end

s = CompX_Habu_Simulator.new
5.times {
 s.try 50000
}

七ﾀｲﾄﾙ戦のうち､七番勝負が四回､五番勝負が三回です｡
対戦の勝率 57% で､七ﾀｲﾄﾙのうち何勝取ったかをｶｳﾝﾄします｡
50,000回の試行を 5回繰り返しました｡

# 4勝以上
39356 / 50000 --- 0.78712
39438 / 50000 --- 0.78876
39222 / 50000 --- 0.78444
39307 / 50000 --- 0.78614
39214 / 50000 --- 0.78428

# 5勝以上
25781 / 50000 --- 0.51562
25670 / 50000 --- 0.5134
25571 / 50000 --- 0.51142
25606 / 50000 --- 0.51212
25803 / 50000 --- 0.51606

# 6勝以上
10857 / 50000 --- 0.21714
10971 / 50000 --- 0.21942
10974 / 50000 --- 0.21948
10844 / 50000 --- 0.21688
10955 / 50000 --- 0.2191

勝ち越すかどうかでいうと､勝ち越す確率は 78?79% くらい｡
圧倒的と言える 1回取りこぼすかどうかという確率は､22% くらいです｡

まあ､試行回数が多くなるとこうなります｡

ちょっと視点を変えて､一生の間にこの対戦をするのは多くても6回くらいだろう､と想定して､延べ6年年に7回のﾀｲﾄﾙ戦を戦って強豪ｿﾌﾄX が獲得したﾀｲﾄﾙの数の度数分布を取ってみました｡

ﾀｲﾄﾙ数	度数
0	0
1	0
2	24
3	93
4	263
5	387
6	233

ｸﾞﾗﾌにすると､こんな感じ｡

6年の対戦で､ﾀｲﾄﾙを多くとった年が 4年以下が 38% の確率｡
観戦する立場でいうと､ｻﾝﾌﾟﾘﾝｸﾞは一回だけですから､どっこいどっこいか 6年のうち 2年はﾀｲﾄﾙ数が負けているのが 5回に2回くらいの確率であります｡

強豪ｿﾌﾄX が圧倒的に強いというには､微妙なところです｡