人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

統計調査の母集団1億3千万人に対する実施対象は1,500人という定数について

今、テレビ(民放)が、“日本人の○○について調査する場合、正確な結果を得るために必要な調査実施対象数は、統計学的には、国民1億3千万人に対し1千5百人以上とされている“ 旨、言っていました。この1千5百人という統計学上の定数の根拠について、お教え頂けないでしょうか。

上記「○○」に代入される事物によって、1千5百という数値は変わるでしょうし、ローカル性(例えば、均質な回答が集まる傾向がある、等)もこの数字に影響を与えているでしょう。でなければ、1千5百/1億3千という中途半端な数は出てこないでしょう。

もし前段が当たっているとすれば、「その定数は、△△という事実(ないし定説)を参照しているのだろう」のような回答をお願いしたく存じます。

(私は以前から、統計調査において母集団に対して設定される調査対象数や、調査結果における「有意な差」の判定法などに疑問があります。例えば、先生がプランを練っているのを見ると、「誤差の相場は±5%だからね…」のように、恣意的な閾値を設定しています。本質問には、この類の疑問が根底にあります)

●質問者: akkeyyyy
●カテゴリ:政治・社会 科学・統計資料
○ 状態 :終了
└ 回答数 : 6/6件

▽最新の回答へ

1 ● パングミキャンディー
●17ポイント

たぶん学者さん達の勘じゃないでしょうか?中3の数学で母集団から無作為に抽出するなんて習いましたよね?確かに調べが少なすぎても正確にならないんですが多すぎてもそれなら無作為に抽出する意味ないんで国民全員を調査したほうがいいんじゃないでしょうか?ちなみに学者さん一人一人の考えは違うのでその数字を出した計算なんてありません。学者さん達の今までの感覚だと思います!


akkeyyyyさんのコメント
basketball-pony 様、はじめまして。 > 中3の数学で母集団から無作為に抽出するなんて習いましたよね? そんなのありましたっけ? 全く記憶にありません。要領が変わったのでしょうか。日本はこれから先細りですので、統計などをやんわりと教えて、〈啓蒙によって緩やかに諦念を導く〉とでも言えるような、世代をまたぎながらのソフト・ランディング・コースを設定しているのでしょうか。 単に私が覚えていないだけかもしれませんが。

2 ● practicalscheme
●17ポイント

さすがに全くの「勘」は無いですよ…きちんと数学的な根拠があります。

但し、数学的な解析にはモデルが成り立つ前提があって、現実にはその前提が満たされているかどうかが確実にはわからない、ということはあり得ます。それでもそのモデルの前提を仮定するのが妥当かどうか、というところにはある程度経験の要素が入ってくることがあるので、それを勘と言えば言えなくもないですが、そこに疑問が生じたなら仮定を検証するための手続きを構成して調査すれば良いので、全く何もないところから数字を引っ張り出してきているわけではありません。

さてご質問の数字に関しては、何をどういう精度で求めたいのかがわからない限り妥当かどうかは言えません。より具体的には、一般的にサンプル調査の推計では、「推計したい母集団の値(例えば平均値)が、値aから値bまでの間である確率がp%である」(*)といった形で結果が出てきます。aとbの幅をどのくらい取るか、pをいくつにするか、によって、必要なサンプル数も変わってきます。母集団の分散や分布の形が推計値に影響を与える場合もあり、もしそれらが正確にわかっていないのなら、それらについて仮定を置いて計算を進めるということになります。

具体的なサンプル数の求め方は統計学の教科書にならたいてい出ていると思います。適当な教科書で「信頼区間」あたりをキーワードに探してみてください。ネット上では例えば http://www.naro.affrc.go.jp/org/nfri/yakudachi/sampling/pdf/logical-sample-number.pdf (なお、この資料ではkの値が「危険率5%なら1.96を使う」と天下りに与えられていますが、その値は誤差関数erfの逆関数から計算されます。)

なお、上の(*)の命題の意味は、「同じ母集団から例えば100回繰り返してサンプル調査をしてそれぞれ推計区間[a,b]を求めたとしたら、そのうちp回くらいは正解(母集団の本当の属性値)が推計区間に含まれている」という意味です。この記事が直感的でわかりやすいです。 http://d.hatena.ne.jp/kiwamu_i/20121203/1354520561

ご質問の誤差が危険率のことなのか信頼区間のことなのかはっきりしませんが、その妥当性は結果を何に使うかによって決まってくるものです。「相場」というのは、その分野でのそれまでの経験からその設定が「だいたい使える」とわかっている、という意味でしょう。疑問があればその前提を突っ込んで考えてみる、もしくは質問してみると良いと思います。ただ、危険率にせよ信頼区間にせよ、それらは「正しい答え」があるものではなく、むしろそれらが「問い」の一部なのですから、その意味では恣意的であることは当然と言えます。どういう問いをするかは問う者が考えることです。その問いに意味があるかどうかはまた別の議論となります。


3 ● tak
●17ポイント

標本の信頼性の計算方法

これは信頼区間、信頼度によって少しだけ変わりますが、
t分布表
を見て分かる通り、1000を超えると、そのあとはサンプルを増やす労力に見合う程度ほど信頼度が上がりません。
しかもこれは母集団がいくら増えても変わりません。


practicalschemeさんのコメント
確かに、n<<NならそもそもNは使いませんからね。

4 ● opechuman
●17ポイント

サンプルサイズを決めるにあたっては2つの考え方があります。1つは誤差の幅をどの程度に抑えたいかによって決めるというものです。1億3千万人の身長の平均を知りたいとき、サンプルサイズが100人と1万人では期待値の分散が大きく異なります。例えば1万人なら誤差を1cm未満に抑えられる可能性が高いが、100人の場合、結構な確率で1cm以上になってしまうといったことが考えられます。そこで「XX%の確率で誤差を1cmに抑えるにはサンプルサイズがいくつ必要か」という問いを立て、必要なサンプルサイズを計算するという発想が出てきます。ここで重要なのは差があるかどうか(差の検定)以上に、差の大きさに興味があるということです。統計的には有意に差があるかもしれないけど、実践的には差が5mm程度なら意味がないといったことはよくあることで、分析結果を実際にどのようなことに利用するのかということが関わってきます。

もう1つ、統計学でお馴染みの「第1種の過誤」と「第2種の過誤」を両方とも適度に抑えるにはどの程度のサンプルサイズが必要かという考え方もあります。ざっくりというと、第1種の過誤は「差がないのに差がある」と判断してしまうミス、第2種の過誤は「差があるのに差がない」と判断してしまうミスです。基本的にはこれら2つの過誤はトレードオフの関係にあるのですが、どちらの過誤を起こす可能性も一定以下にするにはどの程度のサンプルサイズが必要かを計算する方法が提案されています。やみくもにサンプルサイズを大きくしても第1種の過誤が発生する可能性が高まるため、数式から多すぎず少なすぎないサイズを求めることは重要といえます。ただし、計算にはいくつかの前提が必要であり、その前提は経験的に与えるしかありません。

以上、2つの考え方を別々のものとして説明しましたが、実際は表裏一体であり、統計学では「検定力」や「検出力」といった概念で議論されています。1500人という数字もこの概念に基づき、政府統計や世論調査研究での実践的な経験をもとにパラメータを設定して算出されたものだと考えられます。「○○によって変わってくるだろ」というのは微妙なところで、おそらく一定のルーチン的な分析を想定しているのだろうと思います。適用する分析手法と分析結果の解釈の仕方が型にはまっている場合、○○の中身に関係なく数式が定まってしまうことはあり得ます(その是非はともかく)。ただし、テレビの担当者はその辺りの事情を把握せず拡大解釈している可能性が高いでしょう。なお、以下のリンク先には検定力のざっくりとした説明が書いてありますが、正確な説明や計算式を知りたい場合は統計書を参照することをお勧めします。検定力は簡単な概念のように思われがちなのですが、実は意外とややこしく、あまり雑に理解すると勘違いする可能性が高いので注意してください。
http://www.u.tsukuba.ac.jp/~hirai.akiyo.ft/meeting13.files/SLAA_5_16(withoutimage).pdf

なお、「有意な差」の判定法への疑問は別途、質問したほうがいいと思います。サンプルサイズの決定の問題と有意水準の恣意性の問題は関係はありますが別個の問題なので。


5 ● meefla
●16ポイント

ネット上のサイトから、サンプル数算定の根拠となる数式を明記しているものを3つ挙げます。

1. 世論調査に見る統計処理(tak さんの回答#3のリンク先にあるのと同じ式)
2. 統計の基礎的手法
3. Sample Size Calculator(英語。数式はページの下の方)

この3つの数式は、変数名が違うこともあって、ぱっと見だと別物のように見えるかもしれませんが、実は全て同じものです。
分数を約分したり、%表示のままで計算しやすいように改変しているだけで、元は一つの数式であったと推測されます。

どのサイトにも明確な出典は記載されていませんでしたが、Google Scholar でいくつか論文を当たってみると、ウィリアム・G.コクラン (William Gemmell Cochran) が書いた "Sampling Techniques (Third ed. 1977年)" らしいとわかりました。
コクラン氏は、グラスゴー大学とケンブリッジ大学に学び、ハーバード大学などに勤務していた統計学者です。教科書クラスの著書が複数あります。また、「コクランの定理」(Cochran’s theorem)というのもあるようです。

"Sampling Techniques" の全文 PDF がネットに落ちていたので確認してみました。(なお、PDF の所在はググれば簡単に見つかりますが、422ページ・31MB のファイルを細い回線でダウンロードする事になるでしょうから、お勧めはしません)
大元になっている数式のスクリーンショットです。
Chapter 4. The Estimation of Sample Size の P75(PDF では P89)より。

f:id:meefla:20151007190740j:image

ここに至る前に Q=(1-P) と定義されていますので、PQ は P(1-P) という上記サイトの 2. や 3. の数式にある要素になり、式を変形して検証していくのも楽でしょう。1. のサイトの数式にある P(100-P) は、前記した%表示用の改変版です。

これらの数式からわかる事は、

10万人以上の集団の世論調査には1500ほどで十分,2000人調べたらお釣りがくる

世論調査に見る統計処理

です。ただし前提条件として信頼度95%・精度±2.5%というのが付きます。また、人数は調査した人の人数ではなく回答した人の人数であるという点にも注意が必要と思われます(有効回答数で判断)。

直近の世論調査の例を見てみると、TBS「世論調査」 では

有効回答数:1200
最大想定誤差:±2.8%

となっています。厳密に言えば、±2.8%なら1225人の有効回答数が必要ですが、±3%なら1068人で良いわけで、目くじらを立てる程の問題ではないでしょう。

以上、お役に立てることを祈りつつ。


1-5件表示/7件
4.前の5件|次5件6.
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ