ak2ey4回答ポイント 100pt

統計調査の母集団1億3千万人に対する実施対象は1,500人という定数について

今、テレビ（民放）が、“日本人の○○について調査する場合、正確な結果を得るために必要な調査実施対象数は、統計学的には、国民1億3千万人に対し1千5百人以上とされている“ 旨、言っていました。この1千5百人という統計学上の定数の根拠について、お教え頂けないでしょうか。

上記「○○」に代入される事物によって、1千5百という数値は変わるでしょうし、ローカル性（例えば、均質な回答が集まる傾向がある、等）もこの数字に影響を与えているでしょう。でなければ、1千5百／1億3千という中途半端な数は出てこないでしょう。

もし前段が当たっているとすれば、「その定数は、△△という事実（ないし定説）を参照しているのだろう」のような回答をお願いしたく存じます。

（私は以前から、統計調査において母集団に対して設定される調査対象数や、調査結果における「有意な差」の判定法などに疑問があります。例えば、先生がプランを練っているのを見ると、「誤差の相場は±5%だからね…」のように、恣意的な閾値を設定しています。本質問には、この類の疑問が根底にあります）

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ログインして回答する

ベストアンサー

hathi2015/10/08 00:55:20
満足16pt

１）テレビ（民放）が、“日本人の○○について調査する場合、正確な結果を得るために必要な調査実施対象数は、統計学的には、国民1億3千万人に対し1千5百人以上とされている“ 旨、言っていました。この1千5百人という統計学上の定数の根拠について、お教え頂けないでしょうか。
【１】たぶん、簡単にわかりやすく視聴者向けの説明しただけで、実際は違うことを考えているのだと思います。（後で補足します）なお、国民1億3千万人には乳児から10歳異常の高齢者までいます。この全体を対象に調査するようなことはほとんどないです。世論調査のような場合だと調査は有権者に絞って行います。また選挙の投票状況からもわかるように全有権者が投票するのではないです。調査対象として1500人を選んでも期待する調査ができるのは1500人ではないです。逆に1500人の有効な調査ができるまで2345人の調査をするというやり方もあると思いますが、通常はそのような調査をしません。また調査方法によって対象者が（回答する/回答しない）（回答する場合の回答の内容）が変わってしまうこともあります。同じ対象者でも数日後には状況が変わってしまっていることもあります。そうなると、多くの手間を懸けて多数の調査をする現実的な価値がなくなって、ある程度の状況が｢ひどく間違った考察｣にならない程度でわかればイイということもいえます。それらもあって、手法をきちんと決めて、片寄らない、調査対象者のストレートな意見に近いデータを集める現実的なところを決めているのだと思います。
～～～～～～
２）上記｢○○｣に代入される事物によって、1千5百という数値は変わるでしょうし、ローカル性（例えば、均質な回答が集まる傾向がある、等）もこの数字に影響を与えているでしょう。でなければ、1千5百／1億3千という中途半端な数は出てこないでしょう。
【２】上記｢○○｣に代入される事象によって、推定の対象とする母集団が変わります。1億3千万人を対象に状況を推定すべきことはほとんどないでしょう。乳児～児童～青年～壮年～中高齢～後期高齢までの男女、健康人・障害者、労働年齢に該当する場合収入レベルを関係なく、1億3千万人全体の、身長・体重・運動能力・生活時間の内訳・経済状況・服装の好み・政治的意見を推計しようとすることはマズないです。推計したい全体は多くても数千万人程度でしょう。仮に、次回国家議員選挙で投票する可能性のあるものが、有権者(男4870万人、女5560万人)投票見込み(男1030万人、女900万人)として、そのようなヒトの中からデータを集めるとしたら、調査方法をどう考えるでしょう。もともと安保法制でも、TPPでも、派遣雇用などでも、微妙な回答を集めようとしたら、かなり大変ですから、集めるのは簡単な選択肢数件でしょう。そうすると回答のバラエティは少ないです。極端な話が、（１～6の目が出るサイコロだが、中には1が出やすい、3が出にくいというサイコロも混じっている、どれも１～６が均等に出るとは限らない状態のサイコロが数千万個）あるとき、どんな状態なのかを調べるとしたらどうでしょう。完全に調べるには悉皆調査しないとならないですが、現実的でないです。600個調べて、１～６の目の数別のサイコロの個数の分布状態で、だいたい正常に各目が均一にでるサイコロが多いか、４の目が出るサイコロが多いのじゃないか、2の目がでにくいサイコロが相当あるのではないかなどと推定するのが、現実的でしょう。
ちなみに、エクセルでRandBetween(1, 6)で60万個の目を作ったら、この回は、1:100322,1:98762,3:98844,4:99222,5:101398,6:101452となりました。（1/6の確率でランダムに数字を発生させても、この程度のバラツキが起きるということでしょう）で、このデータを固定して母集団として、(重複を許さないランダムサンプリングで)1500のデータを選びその標本調査での目の状態を6回調査しました。(1:222,2:246,3:262,4:251,5:262,6:257)(1:263,2:211,3:218,4:270,5:283,6:255)(1:264,2:268,3:239,4:224,5:247,6:258)(1:235,2:253,3:248,4:234,5:267,6:263)(1:282,2:234,3:244,4:236,5:219,6:285)(1:251,2:237,3:284,4:246,5:241,6:241)　このサンプル調査で１の目の件数を見ると1500件のサンプルだと｢あてにならない｣ように感じるかもしれません。
では、(重複を許さないランダムサンプリングで)6000のデータを選びその標本調査での目の状態を6回調査してみました。(1:1031,2:980,3:993,4:962,5:1028,6:1006)(1:1014,2:1021,3:907,4:958,5:1036,6:1064)(1:983,2:1009,3:1052,4:989,5:959,6:1008)(1:1047,2:919,3:1033,4:988,5:974,6:1039)(1:1057,2:964,3:976,4:990,5:987,6:1026)(1:967,2:973,3:980,4:991,5:1021,6:1068)　こうして見ると標本数を4倍にしても、｢サンプリング調査では限界があるな｣という感じです。　ある程度の誤差はあるものとしてどこまで誤差を許容するかを考えて、実際の調査計画を立てる必要があるってことでしょう。
さらに、(重複を許さないランダムサンプリングで)600のデータを選びその標本調査での目の状態を6回調査してみました。(1:127,2:93,3:96,4:88,5:107,6:89)(1:105,2:112,3:117,4:99,5:83,6:84)(1:117,2:88,3:79,4:83,5:121,6:112)(1:113,2:101,3:98,4:97,5:97,6:94)(1:96,2:105,3:90,4:92,5:102,6:115)(1:101,2:91,3:95,4:104,5:106,6:103)この結果と母集団60万件の分布状況をみると、600件のランダムサンプリングの結果で母集団の状況を推定するのは、かなり無理があると言わざるをえないと思えます。
こうした実験ではなくて、数学的なモデルでの確率で平均値推定で起こる誤差の検討、許容誤差から述べる標本数の妥当性を考え、現実的な標本数を調査計画の中で決めます。
～～～～～～～～～～～～～～～～～～～
３）もし前段が当たっているとすれば、「その定数は、△△という事実（ないし定説）を参照しているのだろう」のような回答をお願いしたく存じます。
【３】たぶん　1500件というのは、次のサイトのようなことを、ザックリいっているのだと思います。
https://www.pref.saitama.lg.jp/a0206/toukeifaq/q1-8.html
https://www.pref.saitama.lg.jp/a0206/toukeifaq/q1-8-2.html
～～～～～～～～～～～～～～～～～～～～
４）（私は以前から、統計調査において母集団に対して設定される調査対象数や、調査結果における「有意な差」の判定法などに疑問があります。例えば、先生がプランを練っているのを見ると、「誤差の相場は±5%だからね…」のように、恣意的な閾値を設定しています。本質問には、この類の疑問が根底にあります）
【４】何の目的で何を調査するのかを考えて、調査の計画をたてるのがまともです。母集団にも、年齢や日常の生活状況、性別、健康状態、就業している産業、その対象者の周囲の人々の意見、住んでいる地域などがあり、そうした属性によって、個人が持っている意見や関心の有無などが変わります。単にランダムサンプリングしたのでは、母集団の状況を反映してない結果しか出てきません。また、調査対象者が回答するヒトの意見の分布と回答しない人の意見の分布は違っているのが普通です。どうした回収ができているかもわからないと、母集団の状況の推定は難しいです。さらに通常標本調査を依頼するときには、調査をしている事情などを簡単に説明します。そのときに｢現在国会で揉めていますが｣｢世界各国で意見の調整がつかず交渉が長引いていますが｣｢米が｣｢国際紛争が増えていますので｣というような説明をしたり、｢フジテレビグループの調査です｣｢政府の委託調査です｣などを述べるだけで、回答者の数パーセントはそれに影響されるかもしれません。そうすると、ただ調査数だけを問題にするのではだめだということがわかります。また、特に強い見解を持っているのではないヒトの場合、時間の経過で意見は変わります。交渉に落着が見えたり、法案が通りそうになるだけで、意見はくるくると変わるヒトも少なからずいます。　だとすると、調査の結果をどう考えるかが問題になります。また調査の手間や時間、コストも大事です。｢誤差の相場は±5%だから｣は、その調査の目的や調査計画の状況でも変わるのですが、10%、5%、1%、どのあたりをねらうかは、その調査の企画を立てるヒトの考え次第ということもあります。
この下のサイトは勉強になります。
http://web-tan.forum.impressrd.jp/e/2008/05/16/3080
http://web-tan.forum.impressrd.jp/e/2008/03/13/2822
http://web-tan.forum.impressrd.jp/e/2008/06/13/3258

スター

その他の回答

パングミキャンディー2015/10/05 23:32:26
満足17pt

たぶん学者さん達の勘じゃないでしょうか？中3の数学で母集団から無作為に抽出するなんて習いましたよね？確かに調べが少なすぎても正確にならないんですが多すぎてもそれなら無作為に抽出する意味ないんで国民全員を調査したほうがいいんじゃないでしょうか？ちなみに学者さん一人一人の考えは違うのでその数字を出した計算なんてありません。学者さん達の今までの感覚だと思います！

スター
- 1件のコメントを見る
- ak2ey4 2015/10/09 02:24:06
  
  basketball-pony 様、はじめまして。
  
  > 中3の数学で母集団から無作為に抽出するなんて習いましたよね？
  
  そんなのありましたっけ？全く記憶にありません。要領が変わったのでしょうか。日本はこれから先細りですので、統計などをやんわりと教えて、〈啓蒙によって緩やかに諦念を導く〉とでも言えるような、世代をまたぎながらのソフト・ランディング・コースを設定しているのでしょうか。
  
  単に私が覚えていないだけかもしれませんが。
  
  スター

practicalscheme2015/10/06 09:00:53
満足17pt

さすがに全くの「勘」は無いですよ…きちんと数学的な根拠があります。

但し、数学的な解析にはモデルが成り立つ前提があって、現実にはその前提が満たされているかどうかが確実にはわからない、ということはあり得ます。それでもそのモデルの前提を仮定するのが妥当かどうか、というところにはある程度経験の要素が入ってくることがあるので、それを勘と言えば言えなくもないですが、そこに疑問が生じたなら仮定を検証するための手続きを構成して調査すれば良いので、全く何もないところから数字を引っ張り出してきているわけではありません。

さてご質問の数字に関しては、何をどういう精度で求めたいのかがわからない限り妥当かどうかは言えません。より具体的には、一般的にサンプル調査の推計では、「推計したい母集団の値(例えば平均値)が、値aから値bまでの間である確率がp%である」(*)といった形で結果が出てきます。aとbの幅をどのくらい取るか、pをいくつにするか、によって、必要なサンプル数も変わってきます。母集団の分散や分布の形が推計値に影響を与える場合もあり、もしそれらが正確にわかっていないのなら、それらについて仮定を置いて計算を進めるということになります。

具体的なサンプル数の求め方は統計学の教科書にならたいてい出ていると思います。適当な教科書で「信頼区間」あたりをキーワードに探してみてください。ネット上では例えば http://www.naro.affrc.go.jp/org/nfri/yakudachi/sampling/pdf/logical-sample-number.pdf (なお、この資料ではkの値が「危険率5%なら1.96を使う」と天下りに与えられていますが、その値は誤差関数erfの逆関数から計算されます。)

なお、上の(*)の命題の意味は、「同じ母集団から例えば100回繰り返してサンプル調査をしてそれぞれ推計区間[a,b]を求めたとしたら、そのうちp回くらいは正解(母集団の本当の属性値)が推計区間に含まれている」という意味です。この記事が直感的でわかりやすいです。 http://d.hatena.ne.jp/kiwamu_i/20121203/1354520561

ご質問の誤差が危険率のことなのか信頼区間のことなのかはっきりしませんが、その妥当性は結果を何に使うかによって決まってくるものです。「相場」というのは、その分野でのそれまでの経験からその設定が「だいたい使える」とわかっている、という意味でしょう。疑問があればその前提を突っ込んで考えてみる、もしくは質問してみると良いと思います。ただ、危険率にせよ信頼区間にせよ、それらは「正しい答え」があるものではなく、むしろそれらが「問い」の一部なのですから、その意味では恣意的であることは当然と言えます。どういう問いをするかは問う者が考えることです。その問いに意味があるかどうかはまた別の議論となります。

スター

tak2015/10/06 11:55:32
満足17pt

標本の信頼性の計算方法

これは信頼区間、信頼度によって少しだけ変わりますが、
ｔ分布表
を見て分かる通り、1000を超えると、そのあとはサンプルを増やす労力に見合う程度ほど信頼度が上がりません。
しかもこれは母集団がいくら増えても変わりません。

スター

1件のコメントを見る
practicalscheme 2015/10/06 17:17:29

確かに、n<<NならそもそもNは使いませんからね。

スター

opechuman2015/10/07 17:03:09
満足17pt

サンプルサイズを決めるにあたっては2つの考え方があります。1つは誤差の幅をどの程度に抑えたいかによって決めるというものです。1億3千万人の身長の平均を知りたいとき、サンプルサイズが100人と1万人では期待値の分散が大きく異なります。例えば1万人なら誤差を1cm未満に抑えられる可能性が高いが、100人の場合、結構な確率で1cm以上になってしまうといったことが考えられます。そこで「XX%の確率で誤差を1cmに抑えるにはサンプルサイズがいくつ必要か」という問いを立て、必要なサンプルサイズを計算するという発想が出てきます。ここで重要なのは差があるかどうか（差の検定）以上に、差の大きさに興味があるということです。統計的には有意に差があるかもしれないけど、実践的には差が5mm程度なら意味がないといったことはよくあることで、分析結果を実際にどのようなことに利用するのかということが関わってきます。

もう1つ、統計学でお馴染みの「第1種の過誤」と「第2種の過誤」を両方とも適度に抑えるにはどの程度のサンプルサイズが必要かという考え方もあります。ざっくりというと、第1種の過誤は「差がないのに差がある」と判断してしまうミス、第2種の過誤は「差があるのに差がない」と判断してしまうミスです。基本的にはこれら2つの過誤はトレードオフの関係にあるのですが、どちらの過誤を起こす可能性も一定以下にするにはどの程度のサンプルサイズが必要かを計算する方法が提案されています。やみくもにサンプルサイズを大きくしても第1種の過誤が発生する可能性が高まるため、数式から多すぎず少なすぎないサイズを求めることは重要といえます。ただし、計算にはいくつかの前提が必要であり、その前提は経験的に与えるしかありません。

以上、2つの考え方を別々のものとして説明しましたが、実際は表裏一体であり、統計学では「検定力」や「検出力」といった概念で議論されています。1500人という数字もこの概念に基づき、政府統計や世論調査研究での実践的な経験をもとにパラメータを設定して算出されたものだと考えられます。「○○によって変わってくるだろ」というのは微妙なところで、おそらく一定のルーチン的な分析を想定しているのだろうと思います。適用する分析手法と分析結果の解釈の仕方が型にはまっている場合、○○の中身に関係なく数式が定まってしまうことはあり得ます（その是非はともかく）。ただし、テレビの担当者はその辺りの事情を把握せず拡大解釈している可能性が高いでしょう。なお、以下のリンク先には検定力のざっくりとした説明が書いてありますが、正確な説明や計算式を知りたい場合は統計書を参照することをお勧めします。検定力は簡単な概念のように思われがちなのですが、実は意外とややこしく、あまり雑に理解すると勘違いする可能性が高いので注意してください。
http://www.u.tsukuba.ac.jp/~hirai.akiyo.ft/meeting13.files/SLAA_5_16(withoutimage).pdf

なお、「有意な差」の判定法への疑問は別途、質問したほうがいいと思います。サンプルサイズの決定の問題と有意水準の恣意性の問題は関係はありますが別個の問題なので。

スター

meefla2015/10/07 19:20:31
満足16pt

ネット上のサイトから、サンプル数算定の根拠となる数式を明記しているものを3つ挙げます。

1. 世論調査に見る統計処理（tak さんの回答#3のリンク先にあるのと同じ式）
2. 統計の基礎的手法
3. Sample Size Calculator（英語。数式はページの下の方）

この3つの数式は、変数名が違うこともあって、ぱっと見だと別物のように見えるかもしれませんが、実は全て同じものです。
分数を約分したり、％表示のままで計算しやすいように改変しているだけで、元は一つの数式であったと推測されます。

どのサイトにも明確な出典は記載されていませんでしたが、Google Scholar でいくつか論文を当たってみると、ウィリアム・Ｇ．コクラン (William Gemmell Cochran) が書いた "Sampling Techniques (Third ed. 1977年)" らしいとわかりました。
コクラン氏は、グラスゴー大学とケンブリッジ大学に学び、ハーバード大学などに勤務していた統計学者です。教科書クラスの著書が複数あります。また、「コクランの定理」（Cochran’s theorem）というのもあるようです。

"Sampling Techniques" の全文 PDF がネットに落ちていたので確認してみました。（なお、PDF の所在はググれば簡単に見つかりますが、422ページ・31MB のファイルを細い回線でダウンロードする事になるでしょうから、お勧めはしません）
大元になっている数式のスクリーンショットです。
Chapter 4. The Estimation of Sample Size の P75（PDF では P89）より。

ここに至る前に Q=(1-P) と定義されていますので、PQ は P(1-P) という上記サイトの 2. や 3. の数式にある要素になり、式を変形して検証していくのも楽でしょう。1. のサイトの数式にある P(100-P) は、前記した％表示用の改変版です。

これらの数式からわかる事は、

10万人以上の集団の世論調査には1500ほどで十分，2000人調べたらお釣りがくる
世論調査に見る統計処理

です。ただし前提条件として信頼度95％・精度±2.5%というのが付きます。また、人数は調査した人の人数ではなく回答した人の人数であるという点にも注意が必要と思われます（有効回答数で判断）。

直近の世論調査の例を見てみると、TBS「世論調査」では

有効回答数：1200
最大想定誤差：±2.8%

となっています。厳密に言えば、±2.8%なら1225人の有効回答数が必要ですが、±3%なら1068人で良いわけで、目くじらを立てる程の問題ではないでしょう。

以上、お役に立てることを祈りつつ。

スター

ak2ey4
2015/10/12 17:26:31

（ご回答順）

パングミキャンディー (id:basketball-pony) 様

practicalscheme (id:practicalscheme) 様

tak (id:TAK-TAK) 様

opechuman (id:opechuman) 様

meefla (id:meefla) 様

hathi (id:hathi) 様

いつも申し訳ありません。また質問が自動終了してしまいました。

本質問では、皆様それぞれ、数学的な厳密さを重視したご回答から、大人であれば解りそうな概念を使ってご説明くださっているご回答まで、様々な角度からお教えいただきました。たった一つの質問へのご回答の集まりとしては、とても有益だと思います。私以外の、検索などで飛んで来た人にとっても、非常に役立つのではないでしょうか。

コトが極めて自然科学的かつ認識論的な問題ですので、各ご回答に対して、下手にコメントを返すこともできず（もし自分がプロパーの回答者で、お門違いだったり、回答の意味を誤認しているようなコメントが帰ってきたら、どれほど萎えることかと想像すると……）、手元にある、何冊かの統計学の基礎的な文献を参照しつつ考えておりましたら、質問期間の1週間が、いつの間にか終わってしまいました。

前段の文献は、実は、最近、ある国立大学で教えていらっしゃる統計学の先生に、統計学の初歩的な文献をお教え頂きたい旨メールを差し上げたしたところ、「もしあなたが○○な本がよければこれ、△△であればこれ、□□であればこれ……」と、とてもご親切にお教えくださったのですが、何にせよ専門の研究者が挙げる文献で、どれも私の「初歩」とするには困難でした。

しかし本質問へのご回答は、前段の問題を解決するハシゴになってくれるものと思います。いずれのご回答も、私にとっては、精確に理解するには難しいですが、統計調査を理解するにあたってまず戻ってくるベースとして、及び、教養の一つとして頭に入れておくべきものとして、活用させていただくことになると思います。

なお、本質問のそれぞれのご回答を自分なりにまとめたようなコメントを、自分のために書き込んだり、あるいは、本質問の内容を精製した様な形で、別途質問することもあろうかと思われます。そのときには、ぜひまたご教示をお願いできればと存じます。

失礼ながら、本質問は、少し気になって質問した次第でした。しかし、とても価値のある知識を頂戴する結果となりました。大変ありがとうございました。

統計調査の母集団1億3千万人に対する実施対象は1,500人という定数について

ベストアンサー

hathi2015/10/08 00:55:20
満足16pt

その他の回答

パングミキャンディー2015/10/05 23:32:26
満足17pt

ak2ey4 2015/10/09 02:24:06