二変量正規分布の周辺確率分布と条件付き分布の導出

公開日: 更新日:

【2023年4月2週】 【B000】数理統計学 【B050】多次元確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、二変量正規分布の周辺確率分布と条件付き分布を導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

【定理】二変量正規分布の周辺確率分布

【定理】
二変量正規分布の周辺確率分布
Marginal Probability Distribution of Bivariate Normal Distribution

確率変数ベクトル $X,Y$ が二変量正規分布 \begin{align} \mathrm{MN} \left(\boldsymbol{\mu},\boldsymbol{\Sigma}\right) \end{align} に従うとき、 $X,Y$ の周辺確率分布は、それぞれ正規分布 \begin{align} X \sim \mathrm{N} \left(\mu_X,\sigma_X^2\right) \quad Y \sim \mathrm{N} \left(\mu_Y,\sigma_Y^2\right) \end{align} となる。

導出

導出

二変量正規分布の同時確率密度関数の定義式より、 \begin{align} f \left(x,y\right)=\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2 \left(1-\rho^2\right)}Q \left(x,y\right)\right\} \end{align} $Q \left(x,y\right)$ を変形すると、 \begin{align} Q \left(x,y\right)&= \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2\\ &= \left(\frac{x-\mu_X}{\sigma_x}\right)^2+\rho^2 \left(\frac{x-\mu_X}{\sigma_x}\right)^2-\rho^2 \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2\\ &= \left(1-\rho^2\right) \left(\frac{x-\mu_X}{\sigma_X}\right)^2+ \left\{\frac{y-\mu_Y}{\sigma_Y}-\frac{\rho \left(x-\mu_X\right)}{\sigma_X}\right\}^2 \end{align} $c=\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right)$ とおくと、 \begin{align} Q \left(x,y\right)= \left(1-\rho^2\right) \left(\frac{x-\mu_X}{\sigma_X}\right)^2+ \left(\frac{y-c}{\sigma_Y}\right)^2 \end{align} 周辺確率分布の定義式 $g \left(x\right)=\int_{-\infty}^{\infty}f \left(x,y\right)dy$ より、$x$ の周辺確率分布は、 \begin{align} g \left(x\right)&=\int_{-\infty}^{\infty}{\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2} \left(\frac{x-\mu_X}{\sigma_X}\right)^2-\frac{1}{2 \left(1-\rho^2\right)} \left(\frac{y-c}{\sigma_Y}\right)^2\right\}dy}\\ &=\int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}dy}\\ &=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \int_{-\infty}^{\infty}{\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\}dy} \end{align} ここで、 \begin{align} h \left(y\right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\} \end{align} は、 正規分布 \begin{align} \mathrm{N} \left\{c, \left(1-\rho^2\right)\sigma_Y^2\right\} \end{align} の確率密度関数だとみることができる。 したがって、確率密度関数の性質 $\int_{-\infty}^{\infty}f \left(x\right)dx=1$ より、 \begin{align} g \left(x\right)=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \end{align} これは、正規分布 \begin{align} \mathrm{N} \left(\mu_X,\sigma_X^2\right) \end{align} の確率密度関数である。 $\blacksquare$

【定理】二変量正規分布の条件付き確率分布

【定理】
二変量正規分布の条件付き確率分布
Conditional Probability Distribution of Bivariate Normal Distribution

確率変数ベクトル $X,Y$ が二変量正規分布 \begin{align} \mathrm{MN} \left(\boldsymbol{\mu},\boldsymbol{\Sigma}\right) \end{align} に従うとき、 (i)$X=x$ が与えられたときの $Y$ の条件付き周辺確率分布は、正規分布 \begin{align} Y \sim \mathrm{N} \left[\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right] \end{align} となる。 (ii)$Y=y$ が与えられたときの $X$ の条件付き周辺確率分布は、正規分布 \begin{align} X \sim \mathrm{N} \left[\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right), \left(1-\rho^2\right)\sigma_X^2\right] \end{align} となる。

導出

導出

(i)$X=x$ が与えられたとき
二変量正規分布の同時確率密度関数の定義式より、 \begin{gather} f \left(x,y\right)=\frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}}\mathrm{exp} \left\{-\frac{1}{2 \left(1-\rho^2\right)}Q \left(x,y\right)\right\}\\ Q \left(x,y\right)= \left(\frac{x-\mu_X}{\sigma_x}\right)^2-2\rho \cdot \frac{ \left(x-\mu_X\right) \left(y-\mu_Y\right)}{\sigma_X\sigma_Y}+ \left(\frac{y-\mu_Y}{\sigma_Y}\right)^2 \end{gather} $c=\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right)$ とおくと、 \begin{align} f \left(x,y\right)=\frac{1}{\sqrt{2\pi\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-\mu_X\right)^2}{2\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\} \end{align} $X$ の周辺確率密度関数を $g \left(x\right)$ とすると、 \begin{align} X \sim \mathrm{N} \left(\mu_X,\sigma_X^2\right) \end{align} であるから、 条件付き分布の定義式 $h \left(\ y\ \middle|\ x\ \right)=\frac{f \left(x,y\right)}{g \left(x\right)}$ より、 \begin{align} h \left(\ y\ \middle|\ x\ \right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-c\right)^2}{2 \left(1-\rho^2\right)\sigma_Y^2}\right\} \end{align} これは、正規分布 \begin{align} \mathrm{N} \left[\mu_Y+\rho \left(\frac{\sigma_Y}{\sigma_X}\right) \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right] \end{align} の確率密度関数だとみなすことができる。 $\blacksquare$

(ii)$Y=y$ が与えられたとき
(i)と同様に、$d=\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right)$ とおくと、 \begin{align} f \left(x,y\right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-d\right)^2}{2 \left(1-\rho^2\right)\sigma_X^2}\right\} \cdot \frac{1}{\sqrt{2\pi\sigma_Y^2}}\mathrm{exp} \left\{-\frac{ \left(y-\mu_Y\right)^2}{2\sigma_Y^2}\right\} \end{align} $Y$ の周辺確率密度関数を $h \left(y\right)$ とすると、 \begin{align} Y \sim \mathrm{N} \left(\mu_Y,\sigma_Y^2\right) \end{align} であるから、 条件付き分布の定義式 $g \left(\ y\ \middle|\ x\ \right)=\frac{f \left(x,y\right)}{h \left(x\right)}$ より、 \begin{align} g \left(\ y\ \middle|\ x\ \right)=\frac{1}{\sqrt{2\pi \left(1-\rho^2\right)\sigma_X^2}}\mathrm{exp} \left\{-\frac{ \left(x-d\right)^2}{2 \left(1-\rho^2\right)\sigma_X^2}\right\} \end{align} これは、正規分布 \begin{align} \mathrm{N} \left[\mu_X+\rho \left(\frac{\sigma_X}{\sigma_Y}\right) \left(y-\mu_Y\right), \left(1-\rho^2\right)\sigma_X^2\right] \end{align} の確率密度関数だとみなすことができる。 $\blacksquare$

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.157-158

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ