統計調査の母集団1億3千万人に対する実施対象は1,500人という定数について今､ﾃﾚﾋﾞ(民放)が､“日本人の○○について調査する場合､正確な結果を得るために必要な調査…

統計調査の母集団1億3千万人に対する実施対象は1,500人という定数について

今､ﾃﾚﾋﾞ(民放)が､“日本人の○○について調査する場合､正確な結果を得るために必要な調査実施対象数は､統計学的には､国民1億3千万人に対し1千5百人以上とされている“ 旨､言っていました｡この1千5百人という統計学上の定数の根拠について､お教え頂けないでしょうか｡

上記｢○○｣に代入される事物によって､1千5百という数値は変わるでしょうし､ﾛｰｶﾙ性(例えば､均質な回答が集まる傾向がある､等)もこの数字に影響を与えているでしょう｡でなければ､1千5百／1億3千という中途半端な数は出てこないでしょう｡

もし前段が当たっているとすれば､｢その定数は､△△という事実(ないし定説)を参照しているのだろう｣のような回答をお願いしたく存じます｡

(私は以前から､統計調査において母集団に対して設定される調査対象数や､調査結果における｢有意な差｣の判定法などに疑問があります｡例えば､先生がﾌﾟﾗﾝを練っているのを見ると､｢誤差の相場は±5%だからね…｣のように､恣意的な閾値を設定しています｡本質問には､この類の疑問が根底にあります)

さすがに全くの｢勘｣は無いですよ…きちんと数学的な根拠があります｡

但し､数学的な解析にはﾓﾃﾞﾙが成り立つ前提があって､現実にはその前提が満たされているかどうかが確実にはわからない､ということはあり得ます｡それでもそのﾓﾃﾞﾙの前提を仮定するのが妥当かどうか､というところにはある程度経験の要素が入ってくることがあるので､それを勘と言えば言えなくもないですが､そこに疑問が生じたなら仮定を検証するための手続きを構成して調査すれば良いので､全く何もないところから数字を引っ張り出してきているわけではありません｡

さてご質問の数字に関しては､何をどういう精度で求めたいのかがわからない限り妥当かどうかは言えません｡より具体的には､一般的にｻﾝﾌﾟﾙ調査の推計では､｢推計したい母集団の値(例えば平均値)が､値aから値bまでの間である確率がp%である｣(*)といった形で結果が出てきます｡aとbの幅をどのくらい取るか､pをいくつにするか､によって､必要なｻﾝﾌﾟﾙ数も変わってきます｡母集団の分散や分布の形が推計値に影響を与える場合もあり､もしそれらが正確にわかっていないのなら､それらについて仮定を置いて計算を進めるということになります｡

具体的なｻﾝﾌﾟﾙ数の求め方は統計学の教科書にならたいてい出ていると思います｡適当な教科書で｢信頼区間｣あたりをｷｰﾜｰﾄﾞに探してみてください｡ﾈｯﾄ上では例えば http://www.naro.affrc.go.jp/org/nfri/yakudachi/sampling/pdf/logical-sample-number.pdf (なお､この資料ではkの値が｢危険率5%なら1.96を使う｣と天下りに与えられていますが､その値は誤差関数erfの逆関数から計算されます｡)

なお､上の(*)の命題の意味は､｢同じ母集団から例えば100回繰り返してｻﾝﾌﾟﾙ調査をしてそれぞれ推計区間[a,b]を求めたとしたら､そのうちp回くらいは正解(母集団の本当の属性値)が推計区間に含まれている｣という意味です｡この記事が直感的でわかりやすいです｡ http://d.hatena.ne.jp/kiwamu_i/20121203/1354520561

ご質問の誤差が危険率のことなのか信頼区間のことなのかはっきりしませんが､その妥当性は結果を何に使うかによって決まってくるものです｡｢相場｣というのは､その分野でのそれまでの経験からその設定が｢だいたい使える｣とわかっている､という意味でしょう｡疑問があればその前提を突っ込んで考えてみる､もしくは質問してみると良いと思います｡ただ､危険率にせよ信頼区間にせよ､それらは｢正しい答え｣があるものではなく､むしろそれらが｢問い｣の一部なのですから､その意味では恣意的であることは当然と言えます｡どういう問いをするかは問う者が考えることです｡その問いに意味があるかどうかはまた別の議論となります｡

ｻﾝﾌﾟﾙｻｲｽﾞを決めるにあたっては2つの考え方があります｡1つは誤差の幅をどの程度に抑えたいかによって決めるというものです｡1億3千万人の身長の平均を知りたいとき､ｻﾝﾌﾟﾙｻｲｽﾞが100人と1万人では期待値の分散が大きく異なります｡例えば1万人なら誤差を1cm未満に抑えられる可能性が高いが､100人の場合､結構な確率で1cm以上になってしまうといったことが考えられます｡そこで｢XX%の確率で誤差を1cmに抑えるにはｻﾝﾌﾟﾙｻｲｽﾞがいくつ必要か｣という問いを立て､必要なｻﾝﾌﾟﾙｻｲｽﾞを計算するという発想が出てきます｡ここで重要なのは差があるかどうか(差の検定)以上に､差の大きさに興味があるということです｡統計的には有意に差があるかもしれないけど､実践的には差が5mm程度なら意味がないといったことはよくあることで､分析結果を実際にどのようなことに利用するのかということが関わってきます｡

もう1つ､統計学でお馴染みの｢第1種の過誤｣と｢第2種の過誤｣を両方とも適度に抑えるにはどの程度のｻﾝﾌﾟﾙｻｲｽﾞが必要かという考え方もあります｡ざっくりというと､第1種の過誤は｢差がないのに差がある｣と判断してしまうﾐｽ､第2種の過誤は｢差があるのに差がない｣と判断してしまうﾐｽです｡基本的にはこれら2つの過誤はﾄﾚｰﾄﾞｵﾌの関係にあるのですが､どちらの過誤を起こす可能性も一定以下にするにはどの程度のｻﾝﾌﾟﾙｻｲｽﾞが必要かを計算する方法が提案されています｡やみくもにｻﾝﾌﾟﾙｻｲｽﾞを大きくしても第1種の過誤が発生する可能性が高まるため､数式から多すぎず少なすぎないｻｲｽﾞを求めることは重要といえます｡ただし､計算にはいくつかの前提が必要であり､その前提は経験的に与えるしかありません｡

以上､2つの考え方を別々のものとして説明しましたが､実際は表裏一体であり､統計学では｢検定力｣や｢検出力｣といった概念で議論されています｡1500人という数字もこの概念に基づき､政府統計や世論調査研究での実践的な経験をもとにﾊﾟﾗﾒｰﾀを設定して算出されたものだと考えられます｡｢○○によって変わってくるだろ｣というのは微妙なところで､おそらく一定のﾙｰﾁﾝ的な分析を想定しているのだろうと思います｡適用する分析手法と分析結果の解釈の仕方が型にはまっている場合､○○の中身に関係なく数式が定まってしまうことはあり得ます(その是非はともかく)｡ただし､ﾃﾚﾋﾞの担当者はその辺りの事情を把握せず拡大解釈している可能性が高いでしょう｡なお､以下のﾘﾝｸ先には検定力のざっくりとした説明が書いてありますが､正確な説明や計算式を知りたい場合は統計書を参照することをお勧めします｡検定力は簡単な概念のように思われがちなのですが､実は意外とややこしく､あまり雑に理解すると勘違いする可能性が高いので注意してください｡
http://www.u.tsukuba.ac.jp/~hirai.akiyo.ft/meeting13.files/SLAA_5_16(withoutimage).pdf

なお､｢有意な差｣の判定法への疑問は別途､質問したほうがいいと思います｡ｻﾝﾌﾟﾙｻｲｽﾞの決定の問題と有意水準の恣意性の問題は関係はありますが別個の問題なので｡

ﾈｯﾄ上のｻｲﾄから､ｻﾝﾌﾟﾙ数算定の根拠となる数式を明記しているものを3つ挙げます｡

1. 世論調査に見る統計処理(tak さんの回答#3のﾘﾝｸ先にあるのと同じ式)
2. 統計の基礎的手法
3. Sample Size Calculator(英語｡数式はﾍﾟｰｼﾞの下の方)

この3つの数式は､変数名が違うこともあって､ぱっと見だと別物のように見えるかもしれませんが､実は全て同じものです｡
分数を約分したり､％表示のままで計算しやすいように改変しているだけで､元は一つの数式であったと推測されます｡

どのｻｲﾄにも明確な出典は記載されていませんでしたが､Google Scholar でいくつか論文を当たってみると､ｳｨﾘｱﾑ･G．ｺｸﾗﾝ (William Gemmell Cochran) が書いた "Sampling Techniques (Third ed. 1977年)" らしいとわかりました｡
ｺｸﾗﾝ氏は､ｸﾞﾗｽｺﾞｰ大学とｹﾝﾌﾞﾘｯｼﾞ大学に学び､ﾊｰﾊﾞｰﾄﾞ大学などに勤務していた統計学者です｡教科書ｸﾗｽの著書が複数あります｡また､｢ｺｸﾗﾝの定理｣(Cochran’s theorem)というのもあるようです｡

"Sampling Techniques" の全文 PDF がﾈｯﾄに落ちていたので確認してみました｡(なお､PDF の所在はｸﾞｸﾞれば簡単に見つかりますが､422ﾍﾟｰｼﾞ･31MB のﾌｧｲﾙを細い回線でﾀﾞｳﾝﾛｰﾄﾞする事になるでしょうから､お勧めはしません)
大元になっている数式のｽｸﾘｰﾝｼｮｯﾄです｡
Chapter 4. The Estimation of Sample Size の P75(PDF では P89)より｡

ここに至る前に Q=(1-P) と定義されていますので､PQ は P(1-P) という上記ｻｲﾄの 2. や 3. の数式にある要素になり､式を変形して検証していくのも楽でしょう｡1. のｻｲﾄの数式にある P(100-P) は､前記した％表示用の改変版です｡

これらの数式からわかる事は､

10万人以上の集団の世論調査には1500ほどで十分，2000人調べたらお釣りがくる
世論調査に見る統計処理

です｡ただし前提条件として信頼度95％･精度±2.5%というのが付きます｡また､人数は調査した人の人数ではなく回答した人の人数であるという点にも注意が必要と思われます(有効回答数で判断)｡

直近の世論調査の例を見てみると､TBS｢世論調査｣では

有効回答数：1200
最大想定誤差：±2.8%

となっています｡厳密に言えば､±2.8%なら1225人の有効回答数が必要ですが､±3%なら1068人で良いわけで､目くじらを立てる程の問題ではないでしょう｡

以上､お役に立てることを祈りつつ｡