人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

無料なんですが、数字に強い人暇な人来てください。

★前置き
とある集団(30人ぐらい)の誕生数を調べてみたところちょっと偏りがありました。
誕生数1 2人
2 1人
3 3人
4 5人
5 5人
6 7人
7 5人
8 3人
9 4人

★本題前の事前情報
誕生数というのは、生年月日にある8ケタの数字を全部足して一桁にするという手順で求めます。(大体二桁になるので十の位と一の位をまた足します。)
例:1999年12月18生
1+9+9+9+1+2+1+8=40
40はまだ一桁じゃないので4+0をする=4
みたいな感じです。

★本題
さて、こういう計算方法で誕生数を導き出した場合。
それぞれの誕生数生まれに片寄って出るんでしょうか?

明らかに1や2が出にくい計算方法になっている……など。
2000年以降生まれとそうじゃない人で出やすい数字が変わってくるとか。

なんとなく二桁から一桁にする時に出やすい数字と出にくい数字があるんじゃないかと思ったりもしないではないですが……。

面倒なので質問しました。暇な人お願いします。


●質問者: 只野迂舞某
●カテゴリ:学習・教育 科学・統計資料
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

質問者から

二桁が29とかになったら2+9をして11になるので1+1で2になります。


1 ● jan8
ベストアンサー

EXCELで1970年1月1日から2015年11月19日まで
単純に機械的に16759行使って計算してみました。

誕生数1 1863人
誕生数2 1864人
誕生数3 1861人
誕生数4 1862人
誕生数5 1862人
誕生数6 1862人
誕生数7 1861人
誕生数8 1862人
誕生数9 1862人

一様分布と言う結果に・・・間違ってるかな?


只野迂舞某さんのコメント
ありがとうございます。 偏らないんですね。不思議です。

2 ● rsc

1950年から2050年までの1月1日から12月31までについて調べて平均をとってみると、同じぐらいになりました。(^_^;
また、2000年から2050年もやってみましたが、ちょっと変わりますが、似たようなものです。(^_^;
ちなみに、プログラムをコンソールで実行して、よく眺めてみると、周期的な右斜め下(\)の平行線が見えます。(^_^;
※参考URL
http://d.hatena.ne.jp/rsc96074/20151119/1447943295


只野迂舞某さんのコメント
ブログ読ませていただきました。なんとなく納得できました。 ありがとうございました。

3 ● a-kuma3

かきつばたに投稿がないのだ(約一名を除いて)。
投稿を読むために取っておいた時間が多少 余っているのだ。
# 決して暇なわけでもないし、数字に強いわけではない

第一印象

月の変わり目で不連続になるから、分布に偏りができても不思議ではないなあ、という気もする。

やってみる

def cabara_number s
 n = 0
 s.split('').each { |i|
 n += i.to_i
 }
 if n >= 10 then
 n = cabara_number n.to_s
 end
 n
end

map = {}
(0...10).each { |i|
 map[i] = 0
}

t = Time.gm(1970, 1, 1, 0, 0, 0)
t_end = Time.now
while t <= t_end
 n = cabara_number t.strftime("%Y%m%d")
 map[n] += 1
 t += 24*60*60
end

puts map

結果。

{0=>0, 1=>1863, 2=>1864, 3=>1861, 4=>1862, 5=>1862, 6=>1862, 7=>1861, 8=>1862, 9=>1862}

# 言語を変えたって、そりゃあ VBA や Python と同じ結果になるわなあ……

考え直してみる

月の変わり目に不連続になるにしても、年月が同じなら誕生数は連続になる。
日付の十の位が増えるときはどうだろう。
9 → 10
9 : 9
10 : 1 + 0 → 1
19 → 20
19 : 1 + 9 → 10 → 1 + 0 → 1
20 : 2 + 0 → 2
29 → 30
29 ; 2 + 9 → 11 → 1 + 1 → 2
30 : 3 + 0 → 3
28?30個の連続した数字は均等に分布する。
一日(月の始め)の値がばらけるにしても、年月を変えて平均すれば均等に分布するだろう。

何故、とある集団で偏りが出たのだろう

・仮説 その1:偶々
母集団の分布がある確率関数によって表されるとしても、そこから抽出した標本はばらつく。
統計検定で分布度の検定をすれば良いのかな。
# やってみれ、ってか

・仮説 その2:とある集団に偏りがある
早生まれだと学校に入ったときにさが大きいからと、4月1日に生まれたのに、4月2日として届ける人が多いんだそうな。
後、最近は病院で産む人がほとんどなので、年末年始に生まれている人が少ない。
薬で調節したり、腹を切ったり。
そんなこんなで誕生日の分布には偏りがあるから、それが影響しているのかも。
# 5?7 に偏っている理由としては薄い

・仮説 その3:誕生数の計算が間違っている
質問しておきながら、想定している誕生数の求め方と、分布を調べたときの求め方に差異がある。
ぼくは、行き詰ったときに「前提にしていることを疑ってみる」という思考をすることがあります。
一見、無駄なようだけど、範囲を狭めるという意味では進展があるし、気分転換にもなったりするので。
# それは、お前が迂闊だからだろうって? (聞こえません




追記です。

統計検定で分布度の検定をすれば良いのかな。
# やってみれ、ってか

まだ執筆中らしいので、やってみた。

「適合度検定」というやつをやる。
やり方はネットにたくさん落ちてる(http://www.tamagaki.com/math/Statistics606.html とか)。

帰無仮説は「誕生数は一様分布である」だ。
対立仮説は「誕生数は一様分布ではない」だ。
有意水準αを 5% とする。
適合度検定に使う統計値は
¥chi^2 = ¥sum_{k} ¥frac{(X_i - m_i)^2}{m_i}

これが自由度 k-1 の χ2分布に従う。

誕生数度数確率期待度数統計値
120.1113.8890.917460317
210.1113.8892.146031746
330.1113.8890.203174603
450.1113.8890.317460317
550.1113.8890.317460317
670.1113.8892.488888889
750.1113.8890.317460317
830.1113.8890.203174603
940.1113.8890.003174603
合計351356.914285714



統計値は 6.914 。

自由度 9-1 = 8 でα=0.05 の値を χ2分布表から求める。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/chi2disttab.html
値は 15.5073 。

6.914 < 15.5073 なので対立仮説は棄却できない。
つまり、これくらいのばらつきはありそうだ、ということ。

ここのサイトで、χ2分布の値を自由に計算できる。
http://keisan.casio.jp/exec/system/1161228834

f:id:a-kuma3:20151120134554p:image
自由度 8 だと、累積確率が40% くらいのところで χ2値が 6.42 で分布のピークくらい。
この近辺は割と出現しやすいくらいの値だと分かります。


a-kuma3さんのコメント
まだ執筆中らしいので、追記しました。

只野迂舞某さんのコメント
なんか追記までありがとうございます。 後半なにいってるのかまったくわからない文系だめ人間ですが(数学は高校一年で終わった)

a-kuma3さんのコメント
2行で要約すると、こんな感じです。 - 年と月を固定して日を変えていくと、誕生数は連続して出てくる。つまり、誕生数の計算方法は、何かの数字だけが出にくい、というような偏りはでてこない。 - サンプルを取ったときに、何かの分布に従ってるのか、ということを統計的に判断する方法を偉い人が編み出しているので、それに則ると質問にあるデータは「誕生数は均等に出てくる」ということを否定するほど珍しいぱらけ方じゃない。

4 ● adlib


零の未発見 ? ゼロのない数列は循環しない ?

この設問の趣旨は頻度の規則性にある。いろは順(年月日)や誕生数
(番号順)に、五十音順(発音)のような法則性は適用できない。
二月に29日が存在するかどうかで、四年ごとに通日番号がずれる。

月末29日は4年毎1回、28日は年1回、30日は年4回 31日は年7回。
年は十進法、月は12進法、日は28-31進法、誕生数は九進法。
この九進法は、九と一が(麻雀牌とおなじく)連続しない。

誕生数の周期 ? Leap 4*, Week 28*, Gregorio 400* ?


00 01 02 03 04 05 06 07 08 09 10 11 12
01 二 三 四 五 六 七 八 九 一 二 三 四
02 三 四 五 六 七 八 九 一 二 三 四 五
03 四 五 六 七 八 九 一 二 三 四 五 六
04 五 六 七 八 九 一 二 三 四 五 六 七
05 六 七 八 九 一 二 三 四 五 六 七 八
06 七 八 九 一 二 三 四 五 六 七 八 九
07 八 九 一 二 三 四 五 六 七 八 九 一
08 九 一 二 三 四 五 六 七 八 九 一 二
09 一 二 三 四 五 六 七 八 九 一 二 三
10 二 三 四 五 六 七 八 九 一 二 三 四
11 三 四 五 六 七 八 九 一 二 三 四 五
12 四 五 六 七 八 九 一 二 三 四 五 六
13 五 六 七 八 九 一 二 三 四 五 六 七
14 六 七 八 九 一 二 三 四 五 六 七 八
15 七 八 九 一 二 三 四 五 六 七 八 九
16 八 九 一 二 三 四 五 六 七 八 九 一
17 九 一 二 三 四 五 六 七 八 九 一 二
18 一 二 三 四 五 六 七 八 九 一 二 三
19 二 三 四 五 六 七 八 九 一 二 三 四
20 三 四 五 六 七 八 九 一 二 三 四 五
21 四 五 六 七 八 九 一 二 三 四 五 六
22 五 六 七 八 九 一 二 三 四 五 六 七
23 六 七 八 九 一 二 三 四 五 六 七 八
24 七 八 九 一 二 三 四 五 六 七 八 九
25 八 九 一 二 三 四 五 六 七 八 九 一
26 九 一 二 三 四 五 六 七 八 九 一 二
27 一 二 三 四 五 六 七 八 九 一 二 三
????????????????????????????????
28 二 三 四 五 六 七 八 九 一 二 三 四
29 三 四* 五 六 七 八 九 一 二 三 四 五
30 四 ◆ 六 七 八 九 一 二 三 四 五 六
31 五 ◆ 七 ◆ 九 ◆ 二 三 ◆ 五 ◆ 七
────────────────────────────────
a 一 二 三 四 五 六 七 八 九
b 一 二 三 四 五 六 七 八 九
c 一 二 三 四 五 六 七 八 九
d 二 三 四 五 六 七 九
e 二 三 四 五 七
f 三 四* 五


暦日は連続しても、年月日が連続しないので、ユリウス通日が開発さ
れた(小数点以下で時刻も百分率表記できる)。
BC-47120101 Julian Data 0(逆算起点)1583 開発。

現在のパソコンにも常備されるが、文字列に変換すると計算できない。
暦に関する質問は、ほとんどが未解決、もしくは誤った結論で終わる。
下記の過去質問は、いますこし応用的な手法を試みた。

http://q.hatena.ne.jp/1287067395(20101014 23:43:18)
教えて、検算に強い方! ? チリ生還者の平均年令 ?
http://d.hatena.ne.jp/adlib/20100805 地利知略の33人

http://q.hatena.ne.jp/1140181086(20060217 21:58:06)
生年月日を8桁数に置換して“合計÷人数=平均値”を算出しました。
http://d.hatena.ne.jp/adlib/19230804 八月四日の立方根

関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ