多変量正規分布とガンマ分布の意外な関係

X ~ N(μ,σ²I) の場合(Iは単位行列),Xμ のユークリッド距離の2乗がガンマ分布に従うみたいですね.

ガンマ分布の確率密度関数は次のような関数です.

これを X ~ Gamma(k,θ) と表記します.

うーん…どうしてユークリッド距離の2乗がガンマ分布に従うのかいまいちピンとこない…
これにはカイ2乗分布が深く関係しているようです.

カイ2乗分布の確率変数をユークリッド距離で表現する

カイ2乗分布はガンマ分布の特殊系で,確率密度関数は z ≧ 0 について,

で表されます.

k個の独立な Xi ~ N(μi,σ²i) について,

がカイ2乗分布に従うわけですが,σiが全てσで共通で,x = (x1, x2, …, xk)Tμ = (μ1, μ2, …, μk)Tとおいた場合は

と表記できます.この時点でマハラノビス距離の2乗がカイ2乗分布に従うということが言えるので,なんだか証明できそうな気がします.

確率変数を変換して確率密度関数を求める

確率変数 x, その確率密度関数 f(x) に対して x = g(y) の変換を考えると,y の確率密度関数 h(y) は次のように表されます.

今回の場合,z の確率密度関数が f(z) で,|x-μ|² = u とおくと,z = u/σ² という変換に対応するので,u の確率密度関数 h(u) は

となります.
これを整理すると,

となるので,U ~ Gamma(k/2, 2σ²) が証明でき,つまりユークリッド距離の2乗がガンマ分布に従うということが言えます.

なかなかおもしろいことを知ったなぁという感じなんですが,けっこう常識なんですかね…

参考

あとはWikipedia様様.

広告
cURLでプロキシを通そうとするとハマった… Mac版SafariだけJavaScriptが文字化けする!?
※このエントリーははてなダイアリーから移行したものです。過去のコメントなどはそちらを参照してください