人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

統計学の問題に行き詰っています!
解法を教えていただきたいです。
問題は2問です。

(1)ある地方では、最初に女の子を産んだ母親の場合は第2子の場合も女の子を産むことが多いと人々は信じています。
そこで、統計を学んだ保健婦が過去の出生記録を調べて、この言い伝えの真偽を調べることにしました。
過去10年に遡った統計記録からは、最初に女の子を産んだ母親が265人いて、その第2子の性別は男子が120人で女子が145人でした。
そこでこの保健婦は、言い伝えは間違っていて第1子の性別と第2子の性別は独立事象であると仮定して、95%の信頼区間を計算し、もしこの地域の統計値がこの信頼区間を外れていれば、言い伝えには根拠があると判断しました。
保健婦は最終的にどんな判断を下しましたか。
補足
(2)保健婦が調査結果を県の上司に報告した際、上司は「日本の人口統計では出生時の男子の割合は51%で女子が49%」であることを教えてくれました。
保健婦がこの情報に基づいて最終判断を下すとどうなりますか

よろしくお願いします!


●質問者: ytisoiruc
●カテゴリ:学習・教育 科学・統計資料
✍キーワード:たか 上司 人口統計 保健婦 地域
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● hathi

(1)統計を学んだ保健婦は、次のように判断する可能性が高いと思います。

?帰無仮説を(男女の出生率は同じ)として、標本265で、55%の女子出生率の確率変数を計算し、棄却域5%の片側検定で1.645と比較すればいい。

?期待値0.5の場合で2項分布の確率変数は1.51となるので、1.645の範囲内になる

?帰無仮説(男女の出生率は同じ)は棄却できない。

?女子出生が多いとは言えない。

?最初に女の子を産んだ母親の場合は第2子の場合も女の子を産むことが多いとは言えない。

?この地域の統計値では、この言い伝えには根拠がないという判断をするのが正しい。

(2)統計を学んだ保健婦は、次のように判断する可能性が高いと思います。

?帰無仮説を(女子出生率49%)として、標本265で、55%の女子出生率の確率変数を計算し、棄却域5%の片側検定で1.645と比較すればいい。

?期待値0.49の場合で2項分布の確率変数は1.86となるので、1.645の範囲を外れる

?帰無仮説(女子出生率49%)は、信頼区間片側95%で棄却される。

?女子出生が多いと言うことになる。

?最初に女の子を産んだ母親の場合は第2子の場合も女の子を産むことが多いと言える。」

?この地域の統計値では、この言い伝えには根拠があると判断をするのが正しい。

??? ??? ???

上記は、この架空の保健婦さんがするであろう判断の中で、一番起きそうだと私が思うものを書いているだけですから、架空の物語だとしても、上記とは異なる判断をされる可能性はあります。 どのような判断をしそうかは、物語の筋だけでは判断できないし、その確率分布も推定できません。

??? ??? ???

ところで、女子出生率を50%から49%に変更して検討することがより正しいと思う根拠は何でしょうか。 この地方の言い伝えは「全国平均よりも女子出生率が高い」ではありません。統計的検証に、全国平均の数値を使うのは妥当とは言い切れません。 場合によっては、問題のすり替えでしかありません。

この地方の言い伝えは「最初に女の子を産んだ母親の場合は第2子の場合も女の子を産むことが多い」であって、第一子の女子出生率、第三子以降の女子出生率と比較して言っているとは限りません。おそらく第一子が男子であった場合の第二子が女子である場合とは比較しているであろうという推定には相当程度妥当性があると思いますが、言い伝えの基本内容は、第一子が女子である場合の第二子の女子出生率ですから、(1)の方が計算としてはまだましだと思います。

しかし、(1)の検証も言い伝えに根拠があるかの検討としてはおかしいと思います。

第二子が50%の確率で女子が出生する場合に現実化する出生率の確率変数の判定、棄却域の設定で信頼性区間を片側95%としていることに問題があると思います。

言い伝えの妥当性を根拠で調べるとしたら、10年間漏れなく第一子が女子であった母親の第二子が男子であったケースが50%以上でなければ、「根拠あり」を否定できないと思います。

偶然にそうなることもあり得ると言い立ててみても、その地方である程度の人数・ある程度の期間の女子比率が50%以下であった事実を実証しなければ、意味はないというか、常識を持ち合わせない・話の通じない保健婦と、地域の人から思われるだけだと思います。

なお『最初に女の子を産んだ母親の場合は第2子の場合も女の子を産むのは、55%%なものです』と地域の人に伝えると、『その程度の小さな差しかないの。3人に2人位は女の子じゃないかと思っていた』と地域の人は思い直すかもしれません。

男の子の多い家族、女の子の多い家族が、現実に多いですし、そうした状況の実際の調査数字はあまり見ませんから。


2 ● hathi
ベストアンサー

補足です。

「本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本」

http://www.amazon.co.jp/%E6%9C%AC%E5%BD%93%E3%81%AB%E3%82%8F%E3%81%8B%E3%82%8A%E3%82%84%E3%81%99%E3%81%84%E3%81%99%E3%81%94%E3%81%8F%E5%A4%A7%E5%88%87%E3%81%AA%E3%81%93%E3%81%A8%E3%81%8C%E6%9B%B8%E3%81%84%E3%81%A6%E3%81%82%E3%82%8B%E3%81%94%E3%81%8F%E5%88%9D%E6%AD%A9%E3%81%AE%E7%B5%B1%E8%A8%88%E3%81%AE%E6%9C%AC-%E5%90%89%E7%94%B0-%E5%AF%BF%E5%A4%AB/dp/476282125X/ref=sr_1_1?ie=UTF8&qid=1309351927&sr=8-1

P231?「第9章 統計的検定の問題点・運用上の留意点」1節は「1 統計的検定は恣意的な面が多々ある」「2 "統計的に有意な差"="実質的に意味がある差"ではない」「3 "有意な差が認められないこと"="差がないこと"ではない」などが、具体的説明と練習問題つきで説明されています。

統計の勉強をされて統計手法を使う可能性があるならば、この本を読んでおくのは良いことだと思います。

簡単に「3 "有意な差が認められないこと"="差がないこと"ではない」を例示すると、次のようなことです。

トランプ(13枚×四種の52枚)の中から、繰り返しを許して300回カードを抜き出した場合、赤あるいは奇数カードの枚数出現比率は50%と期待されます。 52枚のうちクラブの4とスペードの4をハートの3に替えた52枚を使った場合、赤あるいは奇数カードの枚数出現比率は54%と期待されます。

あるカジノで、客はこのカードは赤あるいは奇数カードが多く出ると言い伝えています。

実際に繰り返しを許して300回カードを抜き出して調査したところ、156枚が赤あるいは奇数カードで52%になりました。

統計を勉強してきたと自称する人が2項確率は正規分布すると言って、期待値50%と実際の52%を計算し、片側確率0.69なので(赤あるいは奇数カードが多く出る)とは言えないと言いました。別の人が計算の方法を聞いて期待値54%と変更して実際の52%と計算しました。結果は-0.64になりました。これをどう解釈したら良いのですかと聞かれた(統計を勉強してきたと自称する人)は困りました。

期待確率50%で標本確率54%、期待確率54%で標本確率50%、の二種で計算してみても、片側5%の検定では帰無仮説は棄却できないことになります。(2枚も取り替えたのに300回の試行では95%の片側推定では、標準カードとの差があることが判定できないのです)

◎質問者からの返答

詳しいご回答有難うございます!

ようやく理解することができ、やっと納得がいきました!

またお勧めの本ですが、図書館で見つけたので参考にしています。

本当にありがとうございました。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ