試行を繰り返せば統計的確率は理論的確率に近づくといういわゆる大数の法則と、
例えばコイン投げを100回して100回連続で「表」が出たあとでも、
次の試行で「表」が出る確率も、「裏」が出る確率もともに1/2である、
という一見矛盾する二つの命題がなぜ矛盾しないのか?ということを何年も考えているのですが未だにわかりません。
教えて下さい
コメントで述べられている
100回試行した段階ですべてが「表」だったとしたら、
残りの9900回の試行では、
約100回ぐらいは「裏」の方が「表」よりたくさん出て、
お互いの確率が1/2に近づく
この考えを無意識のうちに真実であると仮定して論理を組み立てていることが、本来矛盾がないことに対して矛盾を感じる原因だと思います。
上の引用部分を「先に偏った結果が出ると後からそれが補填される現象」と呼ぶことにしましょう。
「先に偏った結果が出ると後からそれが補填される現象」と「それぞれの試行が独立事象であるということ」は、確かに矛盾しています。
しかし先に偏った結果が出ると後からそれが補填されるなんて現象は実際には起きませんし、なにより「大数の法則」は「先に偏った結果が出ると後からそれが補填される現象」を説明した言葉はありません。
よって前述の矛盾は、「大数の法則」と「それぞれの試行が独立事象であるということ」が矛盾するという考えの根拠にはなりません。
「大数の法則」を単に「試行を繰り返せば統計的確率は理論的確率に近づく」という意味だときちんと捉えれば、それが「一回一回の試行が独立事象である」と矛盾していないことが理解できるのではないでしょうか?
そこに矛盾は存在しません
例えとしては少々違うかもしれませんが「木を見て森を見ず」といったところでしょうか
あるいは「100回という数値が、それが実は極めて一部であるという事実を隠蔽してしまっている」と表すれば伝わるでしょうか
いずれにせよ、一種の数字マジックのようなものです
大数(無量大数の大数)まではいかないまでも沢山の試行のスタートの100回が偶然連続して表であったというだけの話です
確率の世界から言えば100回は大数の極めて一部でしかないということなのですが、
「人は目先にある判りやすい単位をモノサシにしてしまう」傾向にあるため、
100回という数値を「まるで全体であるかのごとくに錯覚を起こし」てしまい、お悩みのようなことになっています
もういちど繰り返しておきます「そこに矛盾は存在しません」
あなたが矛盾と感じている前提がすでに確率的に偏っているため、矛盾となると思われます。
大数の法則は確率的に同様に確からしい現象は(仮想的に)無限の試行において、理論的確率となるというものであって
前述の仮定をいうならば、
1.大数として十分でない試行の回数で大数の法則を用いている
2.コインの裏と表が出る確率が1/2ではない可能性がある
という2点については考察がなされているのでしょうか。
100回やって同じ面がでつづけることがないとは言いませんが(1/2の100乗=約1.2676506 × 10^30ですから1秒に10000回やっても宇宙誕生から今まで一回も起こらない程度ですが)100回続けて出る時点で確率的に同様に確からしいとはとても思えませんし、このあと9900回やって1万回の試行においては1/2になるかもしれないという確率は考慮に入っているのでしょうか。
自然科学における矛盾という言葉はとても厳密に扱われるべきです。
前提が偽なら結論はすべて真となるため前提を検証することで理解が深まると思います。
理論が違います。
コインの「表」が出る確率も、「裏」が出る確率もともに1/2であるという前提でコイントスをやっている。
コイントスを100回して100回連続で「表」が出たあとでも、次のトスで「表」が出る確率も、「裏」が出る確率もともに1/2であるとするのか、実はいかさまコインで「表」が出るコインを使っていたのか?
10^30分の1しか起こらない珍しいことが起こり続けただけとするのは古典的確率論。その確率から1/2なのかを検証する確率論をベイズ確率論と言います。
http://www.kogures.com/hitoshi/webtext/stat-bayes/index.html
100回連続で表が出たというのは結果であって、次にどっちが出るかというのは未来の話ですよね。
過去100回で表が出た確率は100%ですが、これから表が出る確率は1/2です。
土俵が違います。
コメントで述べられている
100回試行した段階ですべてが「表」だったとしたら、
残りの9900回の試行では、
約100回ぐらいは「裏」の方が「表」よりたくさん出て、
お互いの確率が1/2に近づく
この考えを無意識のうちに真実であると仮定して論理を組み立てていることが、本来矛盾がないことに対して矛盾を感じる原因だと思います。
上の引用部分を「先に偏った結果が出ると後からそれが補填される現象」と呼ぶことにしましょう。
「先に偏った結果が出ると後からそれが補填される現象」と「それぞれの試行が独立事象であるということ」は、確かに矛盾しています。
しかし先に偏った結果が出ると後からそれが補填されるなんて現象は実際には起きませんし、なにより「大数の法則」は「先に偏った結果が出ると後からそれが補填される現象」を説明した言葉はありません。
よって前述の矛盾は、「大数の法則」と「それぞれの試行が独立事象であるということ」が矛盾するという考えの根拠にはなりません。
「大数の法則」を単に「試行を繰り返せば統計的確率は理論的確率に近づく」という意味だときちんと捉えれば、それが「一回一回の試行が独立事象である」と矛盾していないことが理解できるのではないでしょうか?
自分なりに噛み砕いた言葉になってしまいますが。
時間の定義をどうされているのかと、ちょっと気になってしまいました。
統計的に見るなら、コイントスという実験において過去の蓄積データから次に出るコインの面を想定するという、予測行為を行っていることになります。
一方で、コイントスを観察する際に「独立事象」と見なすならば、過去データや未来予測といった、時間軸の観念を捨て去り、捨象した理論で考えていることになるのではないでしょうか。少なくとも、過去データをないものとした上での未来予測という行為になります。
過去情報を組み込むのか、捨象するのか、前提の異なる理論同士を比較して「矛盾しているのではないか」といった指摘なのでしたら、前提が違うのでしたら解も異なってくるでしょうし、大数の法則も、一回一回の試行が独立事象である中での確率論も、それぞれの条件内で正しい定義付けがなされているのではないでしょうか。
>例えばコイン投げを100回して100回連続で「表」が出たあとでも、
>次の試行で「表」が出る確率も、「裏」が出る確率もともに1/2である、
次の試行ですが、過去の100回に依存しないということです。
過去100回仮に表がでてようが、そういう結果に関係ないということです。
そもそも、コイン投げをして100回連続で表が出る確率はかなり低いですから
このようなことを感覚として受け入れること自体が難しいのです。
たとえば、ラスベガスのルーレットで、赤か黒かを選択する場合を考えましょう。
もちろん、00の場合を考えないとして、赤か黒かは毎回1/2です。
10回程度なら、連続して赤がでたりは、実際にもあります。
この場合、10回赤が出たからといって、11回目が黒になる確率が高いなんてありえません。
大数の法則は、かなり多い回数(理論上は無限に近い回数)の場合に、
統計的確率は理論的確率が近くなるといってるだけです。
過去の結果に未来の結果が影響があるのなら、そこには因果律が存在することになります。
そうなると、当然、次回の確率は1/2ではないですが、因果律なんて存在しません。
例えば、一万回コイン投げをすれば、「裏」も「表」だいたい5千回ずつ出るだろうと思います。
1万回という数はちょっと少ないです。ぜんぜん大数じゃないです。
それはおいといて
最初に100回表がでたら、残り9900回でそれを修正するんじゃなくて、残り9900回はたぶん4900-5000回ぐらい表裏がでます。
この一万回をさらにたくさん繰り返すと、中には裏が100回でるときもあるだろうってこと
(ベルヌーイの)大数の法則は試行を繰り返すと理論値からの乖離(隔たり具合)が限りなく小さくなるということを意味しています。
これは「試行を繰り返すと理論値に近づく」という言い方と同じように思えますが、この言い方は大数の法則をものしたベルヌーイの言う文脈からすると誤解を生む表現だと思えます。これは「実際に」試行を繰り返せばある確率に近づくということを言っているのではありません。試行することを先に据えて考えると、たとえばコインが100回連続で表が出た事象を考えれば(べつに1億回表が出てもよいのですが)表が出る確率は100%であると言うことも可能だからです。というか表しか出ないイカサマコインを使えば、そういう結論を導くこともできてしまいますからね。これは表と裏が同じ確率で出る、そういう理想的なコインを使うことをすでに仮定した上での、純粋な思考実験なのです。
言い換えれば、まず理論値1/2が先にありきで、それを実際の現象に当てはめて考えるということです。
蛇足例。現実のコイン(例えば硬貨)は重心が隔たっているので、表裏が均等に出ることはありません。このコインで1/2の大数の法則を確かめることができるでしょうか? 答えはノーです。
このへんの事情は、ピーター・バーンスタイン「リスク<上>ー神々への反逆」に詳しく書かれています。
もうほとんど結論を自分で書かれていますが、100回連続で表が出た、ということとコインの表と裏どちらかが出るかという事象は独立して存在するものであり表が100回出たから次は表になるというのなら、元々そのコインは1/2の確率ではないものなのでしょう。
ただ、自分でも同じことを考えたことはあります。人間心理として同じものが出続けたときに次も同じ面が出る、もしくはここで違う面が出る、と思いがちです。自分は麻雀等ギャンブルが好きなほうですが、そういったなんだかの要素(勝負事)が加わった時に、本来の確率を自分の都合の良い確率、この場合だと連続した面が出るので次も同じ面が出る、と考えてしまうのではないかと思っています。(ちなみに自分ではこの現象を見かけの確率と勝手に呼んでます)
ちなみに、コインの表が100回連続で表になるのは仮にコインの表裏の確率が1/2としたとき、1/2の100乗なので
1,267,650,600,228,238,993,037,566,410,752
という確率になります。
あと、雑学的な話として、ビート武の数学の番組に出ていた数学教授が言っていたのですが、以前あるアメリカの数学者が調べたところ、コイントスの確率はトスするときの上面が出る確立がわずか(51%くらい)に高いそうです。
ちょっとややこしいのですが、正論はすでに出ている様なので、
観念的に読んでみて下さい。
「確率」は、ある現象が起こる度合いで、
ある試行が行われた後に、ある事象が現れる割合のことを指します。
この場合、二面のコインのいずれかの面が出る確率は、
二面あるので、各50%ずつとします。
これは、「偶然性」を含まないひとつに定まった数値であり、
発生の度合いを示す指標として使われるだけです。
一方、確率は50%であったコインの片面が出た、というのは、
例え1回であっても、100回表で出たのであっても、
「観測」です。こちらは「偶然性」も含みます。
確率と観測:
http://ja.wikipedia.org/wiki/確率#.E7.A2.BA.E7.8E.87.E3.81.A8.E8.A6.B3.E6.B8.AC
興味深い考え方としては、「エヴェレットの多世界解釈」を
ご存知でしょうか。コインを空中に投げて、受けて、手で隠す。
コインは二面であり、理論的には、表と裏の出る「確率」は、
半々、それぞれ50%とします。
その後、手をのけて「観測」をすると、表か裏かが判明します。
これについて、多世界解釈では可能性の数だけ、
世界が分岐するという量子学的な解釈がなされます。
(量子論の世界では、事象は決定的でなく確率的に決まるだけですが)
なので、例え、主流であるこの世界で今表が100回出たとしても、
確率的には半々なので、もう一つの世界や別の時間や空間には、
裏が出ていた可能性も「確率的には」あった訳です。
一瞬どらえもんみたいと思いましたが、まともな数式で
これを表している人たちもいて、数学に弱い私は数式でなく、
観念的にしか理解できなかったのですが、私たち人間の知覚では
時間が一方向に連続して流れて行くように思いますが、
もしそれが実際は積み重なったりランダムに起きているような時、
別世界、例えば、過去や未来や別の空間(手でなく空中とか)では
同時にコインの別の面が、同じ位の出ている「確立」もありますよね。
私たちが完全に知覚できる世界だけが宇宙の全てではありませんので、
偶然あなたの手の上で表が出たにしても、空中を舞っているコインが
回転していて、偶然がなければ、同じくらいの確率で
反対の面が表に出ていたが、それをあなたが手に受けた時点で、
「確率」に、確率には含まれない「偶然性」が加わって、
その要素を加えて、後に「観測」した時には、
同じ面が連続で出たように知覚されたものの、
どこでどう受けるとか、そう投げるとかの「偶然性」を
まだ含まない、投げる前のプレーンな一回ずつを見た限りは、
「偶然性」が加わる前の「確率」的には半々のままになります。
投げ方の癖とかの「偶然性」が加わった後の「観測」では、
表が100回出たとしても、投げる前の確立自体の数値は、
変わらないのはこういう考え方もあって、面白いと思います。
http://ja.wikipedia.org/wiki/%E5%A4%9A%E4%B8%96%E7%95%8C%E8%A7%A...
皆さんほどに、背景理論に詳しくありませんが、
下の「大数の法則と一回一回の試行が独立事象であるということがなぜ矛盾しないのか」に回答します。
回数が無限と考えれば良いのでは無いでしょうか。
例えば下にあるように、100回試行した段階ですべてが「表」だったとします。
また次の試行で「表」が出る確率も、「裏」が出る確率もともに1/2とします。
この時、n回目が終了した時点で表の確率で(n→∞)とすれば、
Pn = (100 + (n-100)/2) / n → 1/2
となりますよね。
これが、いわゆる「大数の法則」が意味する事と私は考えておりますが、
認識に問題があるでしょうか。
今回の質問とベイズ確率論とはあまり関係があるようには思えませんでした。