repostベイズフィルターアルゴリズムの証明

注:Mathjaxのtestのための投稿です

ベイズフィルタアルゴリズムの正しさは,次のような帰納法で示すことができる.
状態$x_t$が完備であるときに,事前確率分布から,事後確率分布は計算可能である.
$$p(x_t|z_{1:t},u_{1:t})=\frac{p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t})}{p(z_t|z_{1:t-1},u_{1:t})}$$
$$=\eta p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t})$$

もう一度再確認すると,状態の完備性とは,状態が将来の状態遷移に影響を及ぼさないことである.
さらに,計測値は状態からのみ左右される.
$$ p(z_t|x_t,z_{1:t-1},u_{1:t})=p(z_t|x_t)$$

これを用いると,
$$p(x_t|z_{1:t},u_{1:t})=\eta p(z_t|x_t)p(x_t|z_{t-1},u_{1:t})$$
となる.
すなわち,
$$bel(x_t)=\eta p(z_t|x_t) \bar{bel(x_t)}$$
となる.

つぎに,全確率の定理より計測前の事後信念は次のように展開できる.
$$\bar{bel}(x_t) = p(x_t|z_{1:t-1},u_{1:t})$$
$$= \int p(x_t|x_{t-1},z_{1:t-1},u_{1:t}) p(x_{t-1}|z_{1:t-1},u_{1:t})dx_{t-1}$$

ここで,状態の完備性により以下の等式が成り立つ.
$$p(x_t|x_{t-1},z_{1:t-1},u_{1:t}) = p(x_t|x_{t-1},u_t)$$
ここで,$u_t$のみ残るのは,状態$x_{t-1}$の前に$u_t$が発生することがないからである.
つまり,$u_t$のみ状態の完備性の条件外なのである.そして,この右辺に出てくる確率は,状態遷移確率に他ならない.

以上により,以下が成立する.
$$\bar{bel}(x_t) = \int p(x_t|x_{t-1},u_t)bel(x_{t-1})dx_{t-1}$$

すなわち,ベイズフィルタのアルゴリズムが証明された.

Author: Gusugusu
Link: https://gusugusu1018.github.io/2017/12/04/repostベイズフィルターアルゴリズムの証明/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.

Comment
Catalog