観測方程式と状態方程式の各変数の意味も
説明してください。
線型モデルであるランダムウォークモデルとの
関連も説明してください。
ランダムウォークモデルでの条件付き期待値は、
期待値であり確率変数であるも説明してください。
http://www.jcer.or.jp/research/discussion/discussion66.pdf
>状態空間モデルとは? 潜在変数アプローチでは、状態空間モデルを作成して推計する方法が一般的である。状態空間モ. デルとは、観測できない変数にあるメカニズム(状態)を想定してモデルに取り込んで推計する方. 法である
問題がわりと一般的なこともあって, 詳細や各論については文献にあたって勉強するか, 改めて具体的に質問してもらうしかないので, ここでは勉強などの際に理解の助けになれば, という立場で回答させて頂きます.
質問はある程度独立した内容(1)状態空間モデルとは, (2)状態方程式と観測方程式について, (3)条件付き期待値とは, に分けられると思いますので, この分類に沿って各々回答を考えてみました.
(1)状態空間モデル
数学的に状態空間モデルという用語の明確な定義が存在するわけではないので, 少々漠然とした話になるのは御容赦下さい.
状態空間モデルを強いて定義するならば,
着目しているシステムや力学系の状態を完全に記述可能な変数系をとり, その変数系が満たす(微分方程式などの)力学的方程式によってシステムを記述したモデル
と言うことができるかと思います. 物理(力学)を知っていれば, 状態空間モデルとは位相空間(phase space)で考えることだ, と言ってもいいでしょう.
力学から例を挙げて説明してみます. 質点の運動を考えれば, 時刻における質点の位置は運動方程式はを満たします. これをそのまま解析してもいいのですが, 理論的には速度を用いて位相空間での微分方程式として考える方が何かと便利です. 質点の状態は位置と速度で完全に決定されるので, これを状態変数などと呼んで, その時間変化を表わす微分方程式を状態方程式などと呼んで解析の主対象にします.
運動方程式は位置変数の満たす方程式ですが, 質点の力学的状態は位置だけでは定まらないので, これは状態空間モデルとは言えません. 一方, 質点の状態は位置と速度で決定されるので, は状態空間モデルというわけです.
別な言い方をすれば, 状態空間モデルとは一般に高階導関数を含む微分方程式を(新たな変数を導入することで)一階の微分方程式に書き直したモデルである, という程度の認識でもそれほど問題はないかと思います.
なお, どうでもいい話ですが, 私個人としてはこの質問で初めて状態空間モデルという言葉を聞いたこともあり, 少なくとも数物屋にとって方法論としては一般的であっても用語としては必ずしも一般的ではないと思います. 上記のような方法論は数物屋・理論屋であれば極々当たり前にやっていることなので, 改めて「状態空間モデル」などと言われると逆に「何か特別なことをしているのだろうか…」「なんか普通のことをやっているようにしか見えないが…」とか考えてしまって気が散るような…言っても詮無きことですが.
(2)状態方程式と観測方程式
何らかのシステムの状態(コメントを例にすればエンジンの状態)を観測によって同定したいとき, 次のような状態方程式と観測方程式の連立によって問題を定式化することがよく行われます. (以下の式はあくまでも典型例の一つ.)
状態方程式
観測方程式
ここでがシステムの状態を決定する状態変数で, 状態方程式は観測対象のシステム(例えばエンジンとエンジン音でしょうか)を状態空間モデルで記述したものです. (1)の例で言えば, 状態変数の時間変化を表わす方程式です.
を何らかの観測装置を通して観測する過程を記述するのが観測方程式で, が最終的に得られる観測データを表します. 一般に観測装置それ自体も何らかのシステム(力学系)なので内部状態(状態変数)を持ち, 被観測量(入力)に依存して時間発展する様子を(状態空間モデルとして)微分方程式で記述したのが観測方程式です. 観測には普通時々刻々と誤差が混入するので, それをという項でモデル化しています. ここではいわゆるホワイトノイズです.
文脈によっては, 観測装置まで込めた全体のシステムを記述する, 上記連立方程式を指して状態空間モデルと言うこともあるようです.
我々が知り得るのは観測を通して得られるのみなので, そこから実際のシステムの状態を推定する必要があるわけですが, 詳細はフィルター理論の本(カルマンフィルターなどで探せばよいでしょう)の本にあたって下さい.
状態方程式や観測方程式の具体形は, 扱う現象やモデル化の方針によります. 例えば上記の方程式では状態方程式にが含まれないので, 暗黙に, 観測がシステムの挙動に重大な影響を与えることはないと仮定しています. 例えば量子力学のように観測が系の状態に重大な影響をおよぼす場合には, 状態方程式がを含むようにモデル化を行うべきでしょう.
(3)条件付き期待値
詳しくは確率論の本で勉強してもらうしかないわけですが…
「条件付き期待値」という場合, 文脈によって大きく2つの意味があり得るので, どちらの意味で使われているのか枕詞・形容詞などから認識することが重要かと思います. (まともな本や論文であれば式を見れば一目瞭然のはずですが.)
測度論的確率論(主に数学科で習う現代確率論)を知らない人にとって, 条件付き期待値といえば以下の意味であろうかと思います.
を確率変数とする. という条件の下でのの条件付き分布の平均のことを, 「という条件の下での」の条件付き期待値といいなどと書く.
が決まる毎にはただ一つに確定するので, (を固定して考えている)は確率変数ではありません. 確率論ではこれを一般化した概念として「のに関する」条件付き期待値(専門家にとって条件付き期待値といえば通常こちらの意味)を考えるのですが, その際に重要な視点は, においてはパラメータであることと, は確率変数なのでは確率的事象であることです. これを踏まえて, 条件付き期待値は次のような確率変数として「定義」されます.
確率で値をとる確率変数を, のに関する条件付き期待値といいなどと書く.
フィルター理論などで推定量として現われる条件付き期待値はこの意味で考えているので, 定義から確率変数となります.
基本的なアイディアは, という事実が確定すればその条件(制約)の下でのの期待値も確定するのだけれども, は確率的に起こる事象なので, 条件付き期待値の概念を一般化して上記のように確率変数として定式化しておいた方が理論的に扱いやすくなる, というものです.
なお, 条件付き期待値の意味を直感的に把握するためには次の事実が役立ちます. (関数解析を知っている人間にとっては以下を定義とした方がわかり易いです.)
を確率空間, を可算加法族とするとき, 確率変数のへの正射影をのに関する条件付き期待値といい, などと書く. が確率変数のとき, はと一致する.
最後に
> 線型モデルであるランダムウォークモデルとの関連も説明してください
について. これについてはどう回答すればよいか判断がつきませんでした.
前提としては, 「線型モデル」であることと「ランダムウォークモデル」であることは独立した概念です.
コメントにも書きましたが, 線型モデルというのは状態方程式や観測方程式が線型の場合, 上記の例で言えば係数関数やが線型の場合を指します. 非線型モデルに対して, 不動点からの微小変動だけを考えればいいという仮定などの下に, 線型化モデルを考えることはよくあります.
ランダムウォークモデルについては, 上記の説明は全て時間変数が連続的である, すなわち連続時間のモデルとして説明したわけですが, 現象によっては離散時間モデルをたてる場合もあり, その場合に(連続時間モデルと対比して)ランダムウォークモデルとかマルコフ連鎖モデルと呼ぶことがあるかと思います. より狭義には, 状態変数(の一部)をいわゆるランダムウォークとしてモデル化したものをランダムウォークモデルと言うこともあるでしょう.
線型ランダムウォークモデル, 非線型ランダムウォークモデル, 線型確率微分方程式モデル…など色々な可能性が考えられるので, もう少し問題がはっきりしないとどう答えていいのかわからない, というのが正直な所です.
> 状態空間モデルの説明で、エンジンの音を聞いて、その不具合を調べるという事例がありました。 時間の経過とともに、異常音がだんだんと大きくなっていくというケースです。これは、ドリフト正のランダムウォークモデルでも、表せるということでしょうか。
に関して言えば, そのようなモデル化もあり得るかもしれない, としか言いようがありません. 具体的に文献があるならば, (当該分野の素人として)感想を述べることはできますけれども.
前提:対称を線形モデルと仮定して書いてます。
状態空間モデルとは状態方程式と観測方程式を
と言う形式に表記することを言います((とりあえず、制御工学の分野では))
ここで、変数としてxは状態を、wは外乱、uは入力をそれぞれ表します。
各係数行列の中身はモデルに依存します
このモデルの場合外乱が離散的な値であろうと確率論的な値であろうとかまわずに線形モデルとなります。
また、エンジンのモデルで言えば適切な制御入力無しに外乱が入っている場合、システムは発散(エンジンの例で言うと異常音の増大)するはずです。
ありがとうございます。だいぶわかってきました。
Yt=α + βtⅩt + γzt+et(観測方程式)
βt =βt-1 + εt (状態方程式)
において、εt = 0 の場合は、通常の最小二乗法と同じということでいいのでしょうか。
統計の勉強から、その前段階としての確率の勉強をしていて、質問しました。 時間による2階微分を速度vを用いて、連立1階微分方程式にあら
わすと状態空間モデルと呼ぶと理解していいので
しょうか。