人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

標本調査の方法についての質問です。アンケートをパンチ入力したデータの入力精度が99.99%以上であることを証明したいと思います。
回答番号をエクセルで1フィールドに1回答ずつどんどんパンチ入力していくわけなんですが、
例えば、100,000フィールドのデータがある場合、何フィールド無差別抽出し、入力ミスがないことを調べれば、
入力精度99.99%以上であることを証明できるのでしょうか?
また、標本数がいくつであれ、「全数の何%を調べれば、入力精度99.99%を証明できる」ということはできるのでしょうか?

●質問者: taro0
●カテゴリ:コンピュータ 科学・統計資料
✍キーワード:アンケート エクセル データ フィールド 入力
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● talepanda
●35ポイント

99.99%以上の精度であることを証明するためには、標本の大きさ(標本数とは言いません)は母集団の大きさの99.99%であることが必要です。当たり前ですが。


証明ではなく統計的な議論がしたいのであれば、母比率の検定・区間推定、またその際に必要な標本の大きさについて以下のサイトが参考になります。

http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/pconf.html

http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/bohiritu-conf.html

http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/bohiritu-test.html

◎質問者からの返答

ご回答有難うございました。

参考にさせていただきます。


2 ● Mook
●35ポイント

表現的な問題ですが、

パンチ入力したデータの入力精度が99.99%以上であることを証明

するためには、全数調査以外はありません。


統計的にサンプル調査をすることにより

パンチ入力したデータの入力精度が99.99%以上であることを推定

することはできます。


このときの精度は、サンプルの個数によります。

手っ取り早いのは EXCEL を使用すれば、だいたいの感覚がすぐ出せるでしょう。

今回のケースは二項分布になるので、これを計算する関数を使用します。

=critbinom( 検査数, 確率(今回は0.9999), 分布関数の値(精度))

で、境界となる個数が出ます。


例えば、

=critbinom( 10000, 0.9999, 0.7 )

とすると 10000 が

=critbinom( 10000, 0.9999, 0.6 )

とすると、9999 という数字が出ます(実際の境界値は0.64)。


これからは、10000 個調べて、全部が正しくても統計的には

64%の確しかさで入力精度が 99.99 % であるといえる

となります。


10000 個以下では、全部正しくても信頼性は70%以下なので、それ以上の数に関して計算結果を表にすると

試行回数 信頼性 90% 80% 70% 60% 50%
10000 10000 10000 10000 9999 9998
20000 20000 19999 19998 19997 19995
30000 29999 29997 29995 29993 29990
40000 39998 39996 39993 39990 39986
50000 49998 49995 49991 49987 49982

となります。


80%以上の信頼性を持って入力精度が99.99%以上であることを統計的に確認するには

30000 個の調査をするのであれば、誤りが3個以下
20000 個の調査をするのであれば、誤りが1個以下

であるときに、そのように推定できます。

99.99% という数値は高精度なのです。


これを99.9% とすれば、3000個が全て正しければ、

90%以上の確かさで入力精度が99.9%である

と推定することが可能です。

◎質問者からの返答

ご回答有難うございました。

参考にさせていただきます。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ