内挿法で、1999年の比率R1と2002年の比率R2から2000年の比率を求めるのに、

R=R1*2/3+R2*1/3
とします。
それぞれのSEが独立した値としてSE1,SE2として存在するとき、
SE=(2/3)^2*SE1+(1/3)^2*SE
とすると、全体が、4/9+1/9=5/9位に小さくなるのですが?
SE=SE1*2/3+SE2*1/3
でよいのでしょうか?

回答の条件
  • 1人3回まで
  • 登録:2008/05/02 23:21:46
  • 終了:2008/05/09 23:25:03

回答(2件)

id:ita No.1

ita回答回数203ベストアンサー獲得回数472008/05/03 02:07:42

ポイント35pt

たとえば内挿でなく、1999から2002までの平均を考えたとします。

R=(R1+R2)/2

これの分散は SE1/4 + SE2/4 で、もとの半分くらいですね。それもそのはず、

データが2つあって平均をとることでサンプルが増えて誤差を減らしているからです。

id:kojiro_i619

ご回答、ありがとうございます。

内挿法は 

┌─m─┬─n─┐

x1 x x2

x1とx2の間をm:nに内分するには

x=(m*x2+n*x1)/(m+n)

ですので、平均とは異なると思います。SEも1999年と2002年から2000年を予測するのですから、平均ではなく、SEも直線法ですべきではないでしょうか?

SEは予測としては、小さくなるはずは無いからです。

従って、mについての、内挿法をSEについても全く同様なやり方を用いてもかまわないと思います。

文献、特に英文献がありましたら、教えてください。

2008/05/03 14:20:59
id:ita No.2

ita回答回数203ベストアンサー獲得回数472008/05/05 22:18:47

ポイント35pt

あ、分かりにくくてすみません。

まず確認ですがSEてのは Statistical Error、統計誤差の略ですね?

それで「小さくなるはずは無いからです」についてです。

誤差については統計誤差と系統誤差の二つがあります。

系統誤差とは、中間の値が現実には直線的内挿とはズレることから

くる誤差で、これを見積もるのは難しいですね。

「小さくなるはずは無い」というのは、内挿の妥当性が100%でない

からその分誤差が増えるはず、というイメージから来ますが、これは

系統誤差になります。

統計誤差は単純な数学的定義によって計算されます。

X,Yが変数、A,Bが定数の場合、Z=AX+BYの統計誤差は

Zの二乗平均-(Zの平均)の二乗

となり、A^2Xの分散+B^2Yの分散+AB XYの共分散

となり、X,Yが独立ならA^2Xの分散+B^2Yの分散

となります。

m=nの場合は平均(X+Y)/2と同じ式になるので、その場合は統計誤差が減る、というのはOKですよね?

コメント欄を開けていただければ引き続き対応いたします。

id:kojiro_i619

1999年×2/3+2000年×1/3は、簡単な例でいったので、実際は以下のようにします。

1999年と2002年の患者調査(抽出調査)で有病率とその標準誤差(SE)が、調査結果としてあります。データは5歳間隔です。

SEは、複雑な抽出過程からの計算結果で、示されています。

ここで、2000年の患者の有病率及びSEを推定したいわけです。

そこで、

2000年の5-9歳は、1999年では、4-8歳で、2002年では、7-11歳ですから。

1999年で、0-4歳有病率×1/5 + 5-9歳有病率×4/5=4-8歳有病率

2000年で、5-9歳有病率×3/5 + 10-14歳有病率×2/5=7-11歳有病率

として、1999年の4-8歳有病率×2/3+2000年の7-11歳有病率×1/3

で2000年の有病率を推定するつもりです。

そのさい、SEは、平均値などではないので、小さくなるはずがないと言ったわけです。

SEも、有病率と同様の処理をするつもりです。

2008/05/07 08:56:18

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません