二桁が29とかになったら2+9をして11になるので1+1で2になります。
▽1
●
jan8![]() |
EXCELで1970年1月1日から2015年11月19日まで
単純に機械的に16759行使って計算してみました。
誕生数1 1863人
誕生数2 1864人
誕生数3 1861人
誕生数4 1862人
誕生数5 1862人
誕生数6 1862人
誕生数7 1861人
誕生数8 1862人
誕生数9 1862人
一様分布と言う結果に・・・間違ってるかな?
1950年から2050年までの1月1日から12月31までについて調べて平均をとってみると、同じぐらいになりました。(^_^;
また、2000年から2050年もやってみましたが、ちょっと変わりますが、似たようなものです。(^_^;
ちなみに、プログラムをコンソールで実行して、よく眺めてみると、周期的な右斜め下(\)の平行線が見えます。(^_^;
※参考URL
http://d.hatena.ne.jp/rsc96074/20151119/1447943295
かきつばたに投稿がないのだ(約一名を除いて)。
投稿を読むために取っておいた時間が多少 余っているのだ。
# 決して暇なわけでもないし、数字に強いわけではない
月の変わり目で不連続になるから、分布に偏りができても不思議ではないなあ、という気もする。
def cabara_number s n = 0 s.split('').each { |i| n += i.to_i } if n >= 10 then n = cabara_number n.to_s end n end map = {} (0...10).each { |i| map[i] = 0 } t = Time.gm(1970, 1, 1, 0, 0, 0) t_end = Time.now while t <= t_end n = cabara_number t.strftime("%Y%m%d") map[n] += 1 t += 24*60*60 end puts map
結果。
{0=>0, 1=>1863, 2=>1864, 3=>1861, 4=>1862, 5=>1862, 6=>1862, 7=>1861, 8=>1862, 9=>1862}
# 言語を変えたって、そりゃあ VBA や Python と同じ結果になるわなあ……
月の変わり目に不連続になるにしても、年月が同じなら誕生数は連続になる。
日付の十の位が増えるときはどうだろう。
9 → 10
9 : 9
10 : 1 + 0 → 1
19 → 20
19 : 1 + 9 → 10 → 1 + 0 → 1
20 : 2 + 0 → 2
29 → 30
29 ; 2 + 9 → 11 → 1 + 1 → 2
30 : 3 + 0 → 3
28?30個の連続した数字は均等に分布する。
一日(月の始め)の値がばらけるにしても、年月を変えて平均すれば均等に分布するだろう。
・仮説 その1:偶々
母集団の分布がある確率関数によって表されるとしても、そこから抽出した標本はばらつく。
統計検定で分布度の検定をすれば良いのかな。
# やってみれ、ってか
・仮説 その2:とある集団に偏りがある
早生まれだと学校に入ったときにさが大きいからと、4月1日に生まれたのに、4月2日として届ける人が多いんだそうな。
後、最近は病院で産む人がほとんどなので、年末年始に生まれている人が少ない。
薬で調節したり、腹を切ったり。
そんなこんなで誕生日の分布には偏りがあるから、それが影響しているのかも。
# 5?7 に偏っている理由としては薄い
・仮説 その3:誕生数の計算が間違っている
質問しておきながら、想定している誕生数の求め方と、分布を調べたときの求め方に差異がある。
ぼくは、行き詰ったときに「前提にしていることを疑ってみる」という思考をすることがあります。
一見、無駄なようだけど、範囲を狭めるという意味では進展があるし、気分転換にもなったりするので。
# それは、お前が迂闊だからだろうって? (聞こえません
統計検定で分布度の検定をすれば良いのかな。
# やってみれ、ってか
まだ執筆中らしいので、やってみた。
「適合度検定」というやつをやる。
やり方はネットにたくさん落ちてる(http://www.tamagaki.com/math/Statistics606.html とか)。
帰無仮説は「誕生数は一様分布である」だ。
対立仮説は「誕生数は一様分布ではない」だ。
有意水準αを 5% とする。
適合度検定に使う統計値は
これが自由度 k-1 の χ2分布に従う。
誕生数 | 度数 | 確率 | 期待度数 | 統計値 |
---|---|---|---|---|
1 | 2 | 0.111 | 3.889 | 0.917460317 |
2 | 1 | 0.111 | 3.889 | 2.146031746 |
3 | 3 | 0.111 | 3.889 | 0.203174603 |
4 | 5 | 0.111 | 3.889 | 0.317460317 |
5 | 5 | 0.111 | 3.889 | 0.317460317 |
6 | 7 | 0.111 | 3.889 | 2.488888889 |
7 | 5 | 0.111 | 3.889 | 0.317460317 |
8 | 3 | 0.111 | 3.889 | 0.203174603 |
9 | 4 | 0.111 | 3.889 | 0.003174603 |
合計 | 35 | 1 | 35 | 6.914285714 |
統計値は 6.914 。
自由度 9-1 = 8 でα=0.05 の値を χ2分布表から求める。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/chi2disttab.html
値は 15.5073 。
6.914 < 15.5073 なので対立仮説は棄却できない。
つまり、これくらいのばらつきはありそうだ、ということ。
ここのサイトで、χ2分布の値を自由に計算できる。
http://keisan.casio.jp/exec/system/1161228834
自由度 8 だと、累積確率が40% くらいのところで χ2値が 6.42 で分布のピークくらい。
この近辺は割と出現しやすいくらいの値だと分かります。
零の未発見 ? ゼロのない数列は循環しない ?
この設問の趣旨は頻度の規則性にある。いろは順(年月日)や誕生数
(番号順)に、五十音順(発音)のような法則性は適用できない。
二月に29日が存在するかどうかで、四年ごとに通日番号がずれる。
月末29日は4年毎1回、28日は年1回、30日は年4回 31日は年7回。
年は十進法、月は12進法、日は28-31進法、誕生数は九進法。
この九進法は、九と一が(麻雀牌とおなじく)連続しない。
誕生数の周期 ? Leap 4*, Week 28*, Gregorio 400* ?
00 01 02 03 04 05 06 07 08 09 10 11 12
01 二 三 四 五 六 七 八 九 一 二 三 四
02 三 四 五 六 七 八 九 一 二 三 四 五
03 四 五 六 七 八 九 一 二 三 四 五 六
04 五 六 七 八 九 一 二 三 四 五 六 七
05 六 七 八 九 一 二 三 四 五 六 七 八
06 七 八 九 一 二 三 四 五 六 七 八 九
07 八 九 一 二 三 四 五 六 七 八 九 一
08 九 一 二 三 四 五 六 七 八 九 一 二
09 一 二 三 四 五 六 七 八 九 一 二 三
10 二 三 四 五 六 七 八 九 一 二 三 四
11 三 四 五 六 七 八 九 一 二 三 四 五
12 四 五 六 七 八 九 一 二 三 四 五 六
13 五 六 七 八 九 一 二 三 四 五 六 七
14 六 七 八 九 一 二 三 四 五 六 七 八
15 七 八 九 一 二 三 四 五 六 七 八 九
16 八 九 一 二 三 四 五 六 七 八 九 一
17 九 一 二 三 四 五 六 七 八 九 一 二
18 一 二 三 四 五 六 七 八 九 一 二 三
19 二 三 四 五 六 七 八 九 一 二 三 四
20 三 四 五 六 七 八 九 一 二 三 四 五
21 四 五 六 七 八 九 一 二 三 四 五 六
22 五 六 七 八 九 一 二 三 四 五 六 七
23 六 七 八 九 一 二 三 四 五 六 七 八
24 七 八 九 一 二 三 四 五 六 七 八 九
25 八 九 一 二 三 四 五 六 七 八 九 一
26 九 一 二 三 四 五 六 七 八 九 一 二
27 一 二 三 四 五 六 七 八 九 一 二 三
????????????????????????????????
28 二 三 四 五 六 七 八 九 一 二 三 四
29 三 四* 五 六 七 八 九 一 二 三 四 五
30 四 ◆ 六 七 八 九 一 二 三 四 五 六
31 五 ◆ 七 ◆ 九 ◆ 二 三 ◆ 五 ◆ 七
────────────────────────────────
a 一 二 三 四 五 六 七 八 九
b 一 二 三 四 五 六 七 八 九
c 一 二 三 四 五 六 七 八 九
d 二 三 四 五 六 七 九
e 二 三 四 五 七
f 三 四* 五