人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

内挿法で、1999年の比率R1と2002年の比率R2から2000年の比率を求めるのに、
R=R1*2/3+R2*1/3
とします。
それぞれのSEが独立した値としてSE1,SE2として存在するとき、
SE=(2/3)^2*SE1+(1/3)^2*SE
とすると、全体が、4/9+1/9=5/9位に小さくなるのですが?
SE=SE1*2/3+SE2*1/3
でよいのでしょうか?

●質問者: kojiro_i619
●カテゴリ:科学・統計資料
✍キーワード:1999年 2000年 2002年 r1 R2
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● ita
●35ポイント

たとえば内挿でなく、1999から2002までの平均を考えたとします。

R=(R1+R2)/2

これの分散は SE1/4 + SE2/4 で、もとの半分くらいですね。それもそのはず、

データが2つあって平均をとることでサンプルが増えて誤差を減らしているからです。

◎質問者からの返答

ご回答、ありがとうございます。

内挿法は

┌─m─┬─n─┐

x1 x x2

x1とx2の間をm:nに内分するには

x=(m*x2+n*x1)/(m+n)

ですので、平均とは異なると思います。SEも1999年と2002年から2000年を予測するのですから、平均ではなく、SEも直線法ですべきではないでしょうか?

SEは予測としては、小さくなるはずは無いからです。

従って、mについての、内挿法をSEについても全く同様なやり方を用いてもかまわないと思います。

文献、特に英文献がありましたら、教えてください。


2 ● ita
●35ポイント

あ、分かりにくくてすみません。

まず確認ですがSEてのは Statistical Error、統計誤差の略ですね?

それで「小さくなるはずは無いからです」についてです。

誤差については統計誤差と系統誤差の二つがあります。

系統誤差とは、中間の値が現実には直線的内挿とはズレることから

くる誤差で、これを見積もるのは難しいですね。

「小さくなるはずは無い」というのは、内挿の妥当性が100%でない

からその分誤差が増えるはず、というイメージから来ますが、これは

系統誤差になります。

統計誤差は単純な数学的定義によって計算されます。

X,Yが変数、A,Bが定数の場合、Z=AX+BYの統計誤差は

Zの二乗平均-(Zの平均)の二乗

となり、A^2Xの分散+B^2Yの分散+AB XYの共分散

となり、X,Yが独立ならA^2Xの分散+B^2Yの分散

となります。

m=nの場合は平均(X+Y)/2と同じ式になるので、その場合は統計誤差が減る、というのはOKですよね?

コメント欄を開けていただければ引き続き対応いたします。

◎質問者からの返答

1999年×2/3+2000年×1/3は、簡単な例でいったので、実際は以下のようにします。

1999年と2002年の患者調査(抽出調査)で有病率とその標準誤差(SE)が、調査結果としてあります。データは5歳間隔です。

SEは、複雑な抽出過程からの計算結果で、示されています。

ここで、2000年の患者の有病率及びSEを推定したいわけです。

そこで、

2000年の5-9歳は、1999年では、4-8歳で、2002年では、7-11歳ですから。

1999年で、0-4歳有病率×1/5 + 5-9歳有病率×4/5=4-8歳有病率

2000年で、5-9歳有病率×3/5 + 10-14歳有病率×2/5=7-11歳有病率

として、1999年の4-8歳有病率×2/3+2000年の7-11歳有病率×1/3

で2000年の有病率を推定するつもりです。

そのさい、SEは、平均値などではないので、小さくなるはずがないと言ったわけです。

SEも、有病率と同様の処理をするつもりです。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ