本稿では、二変量正規分布の周辺確率分布と条件付き分布を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【定理】二変量正規分布の周辺確率分布
【定理】
二変量正規分布の周辺確率分布
Marginal Probability Distribution of Bivariate Normal Distribution
確率変数ベクトル $X,Y$ が二変量正規分布 \begin{align} \mathrm{MN} \left(\boldsymbol{\mu},\boldsymbol{\Sigma}\right) \end{align} に従うとき、 $X,Y$ の周辺確率分布は、それぞれ正規分布 \begin{align} X \sim \mathrm{N} \left(\mu_X,\sigma_X^2\right) \quad Y \sim \mathrm{N} \left(\mu_Y,\sigma_Y^2\right) \end{align} となる。
導出
二変量正規分布の同時確率密度関数の定義式より、 \begin{align} f \left(x,y\right)=\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2 \left(1-\rho^2\right)}Q \left(x,y\right)\right\} \end{align} $Q \left(x,y\right)$ を変形すると、 \begin{align} Q \left(x,y\right)&= \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2\\ &= \left(\frac{x-\mu_X}{\sigma_x}\right)^2+\rho^2 \left(\frac{x-\mu_X}{\sigma_x}\right)^2-\rho^2 \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2\\ &= \left(1-\rho^2\right) \left(\frac{x-\mu_X}{\sigma_X}\right)^2+ \left\{\frac{y-\mu_Y}{\sigma_Y}-\frac{\rho \left(x-\mu_X\right)}{\sigma_X}\right\}^2 \end{align} $c=\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right)$ とおくと、 \begin{align} Q \left(x,y\right)= \left(1-\rho^2\right) \left(\frac{x-\mu_X}{\sigma_X}\right)^2+ \left(\frac{y-c}{\sigma_Y}\right)^2 \end{align} 周辺確率分布の定義式 $g \left(x\right)=\int_{-\infty}^{\infty}f \left(x,y\right)dy$ より、$x$ の周辺確率分布は、 \begin{align} g \left(x\right)&=\int_{-\infty}^{\infty}{\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2} \left(\frac{x-\mu_X}{\sigma_X}\right)^2-\frac{1}{2 \left(1-\rho^2\right)} \left(\frac{y-c}{\sigma_Y}\right)^2\right\}dy}\\ &=\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}dy}\\ &=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}dy} \end{align} ここで、 \begin{align} h \left(y\right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\} \end{align} は、 正規分布 \begin{align} \mathrm{N} \left\{c, \left(1-\rho^2\right)\sigma_Y^2\right\} \end{align} の確率密度関数だとみることができる。 したがって、確率密度関数の性質 $\int_{-\infty}^{\infty}f \left(x\right)dx=1$ より、 \begin{align} g \left(x\right)=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \end{align} これは、正規分布 \begin{align} \mathrm{N} \left(\mu_X,\sigma_X^2\right) \end{align} の確率密度関数である。 $\blacksquare$
【定理】二変量正規分布の条件付き確率分布
【定理】
二変量正規分布の条件付き確率分布
Conditional Probability Distribution of Bivariate Normal Distribution
確率変数ベクトル $X,Y$ が二変量正規分布 \begin{align} \mathrm{MN} \left(\boldsymbol{\mu},\boldsymbol{\Sigma}\right) \end{align} に従うとき、 (i)$X=x$ が与えられたときの $Y$ の条件付き周辺確率分布は、正規分布 \begin{align} Y \sim \mathrm{N} \left[\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right] \end{align} となる。 (ii)$Y=y$ が与えられたときの $X$ の条件付き周辺確率分布は、正規分布 \begin{align} X \sim \mathrm{N} \left[\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right), \left(1-\rho^2\right)\sigma_X^2\right] \end{align} となる。
導出
(i)$X=x$ が与えられたとき
二変量正規分布の同時確率密度関数の定義式より、
\begin{gather}
f \left(x,y\right)=\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2 \left(1-\rho^2\right)}Q \left(x,y\right)\right\}\\
Q \left(x,y\right)= \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2
\end{gather}
$c=\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right)$ とおくと、
\begin{align}
f \left(x,y\right)=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}
\end{align}
$X$ の周辺確率密度関数を $g \left(x\right)$ とすると、
\begin{align}
X \sim \mathrm{N} \left(\mu_X,\sigma_X^2\right)
\end{align}
であるから、
条件付き分布の定義式 $h \left(\ y\ \middle|\ x\ \right)=\frac{f \left(x,y\right)}{g \left(x\right)}$ より、
\begin{align}
h \left(\ y\ \middle|\ x\ \right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}
\end{align}
これは、正規分布
\begin{align}
\mathrm{N} \left[\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right]
\end{align}
の確率密度関数だとみなすことができる。
$\blacksquare$
(ii)$Y=y$ が与えられたとき
(i)と同様に、$d=\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right)$ とおくと、
\begin{align}
f \left(x,y\right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-d\right)^2}{2 \left(1-\rho^2\right)\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-\mu_Y\right)^2}{2\sigma_Y^2}\right\}
\end{align}
$Y$ の周辺確率密度関数を $h \left(y\right)$ とすると、
\begin{align}
Y \sim \mathrm{N} \left(\mu_Y,\sigma_Y^2\right)
\end{align}
であるから、
条件付き分布の定義式 $g \left(\ y\ \middle|\ x\ \right)=\frac{f \left(x,y\right)}{h \left(x\right)}$ より、
\begin{align}
g \left(\ y\ \middle|\ x\ \right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-d\right)^2}{2 \left(1-\rho^2\right)\sigma_X^2}\right\}
\end{align}
これは、正規分布
\begin{align}
\mathrm{N} \left[\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right), \left(1-\rho^2\right)\sigma_X^2\right]
\end{align}
の確率密度関数だとみなすことができる。
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.157-158
0 件のコメント:
コメントを投稿