本稿では、カイ2乗分布の定義と概要についてまとめています。確率密度関数であることの証明、確率密度関数の導出、期待値・分散、最頻値、モーメント母関数、再生性の紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
カイ2乗分布
定義・意味
確率変数 $Z$ が標準正規分布 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} に従うとき、 互いに独立な $n$ 個の無作為標本 $Z_1,Z_2, \cdots ,Z_n$ の2乗和 \begin{align} \chi^2=Z_1^2+Z_2^2+ \cdots +Z_n^2 \end{align} が従う 連続型確率分布を自由度 $n$ の $\chi^2$分布 chi-squared distribution という。
確率密度関数
確率密度関数 $f(x)$ は、 \begin{gather} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}&0 \le x\\0&\mathrm{other}\\\end{matrix}\right.\\ n= \left\{1,2, \cdots \right\} \end{gather} で与えられる。
略記法
また、$\chi^2$分布は、 \begin{align} \chi^2 \left(n\right) \end{align} と略記されることがある。
確率密度関数であることの証明
(i)すべての $x$ に関して、$f \left(x\right) \geq 0$ \begin{gather} 0 \lt \Gamma \left(\frac{n}{2}\right),0 \lt 2^\frac{n}{2}\Rightarrow0 \lt \frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}\\ 0 \lt x\Rightarrow0 \lt x^{\frac{n}{2}-1}\\ 0 \lt e^a\Rightarrow0 \lt e^{-\frac{x}{2}} \end{gather} したがって、 \begin{align} f \left(x\right)=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} \geq 0 \end{align} (ii)すべての確率の和が1 \begin{align} \int_{0}^{\infty}f \left(x\right)dx&=\int_{0}^{\infty}{\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}x^{\frac{n}{2}-1} \cdot e^{-\frac{x}{2}}dx}\\ &=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}\int_{0}^{\infty}{x^{\frac{n}{2}-1} \cdot e^{-\frac{x}{2}}dx} \end{align} ここで、以下のように変数変換すると、 \begin{gather} t=\frac{x}{2}\Leftrightarrow x=2t\\ \frac{dx}{dt}=2\Rightarrow dx=2dt\\ x:0\rightarrow\infty \quad \Rightarrow \quad t:0\rightarrow\infty \end{gather} となるので、 置換積分法により、 \begin{align} \int_{0}^{\infty}f \left(x\right)dx&=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}\int_{0}^{\infty}{ \left(2t\right)^{\frac{n}{2}-1} \cdot e^{-t} \cdot 2dt}\\ &=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)} \cdot 2^\frac{n}{2}\int_{0}^{\infty}{t^{\frac{n}{2}-1} \cdot e^{-t}dt}\\ &=\frac{1}{\Gamma \left(\frac{n}{2}\right)}\int_{0}^{\infty}{t^{\frac{n}{2}-1} \cdot e^{-t}dt} \end{align} ガンマ関数の定義式 $\Gamma \left(\alpha\right)=\int_{0}^{\infty}{x^{\alpha-1} \cdot e^{-x}dx}$ より、$\alpha=\frac{n}{2}$ とすると、 \begin{align} \int_{0}^{\infty}f \left(x\right)dx=\frac{\Gamma \left(\frac{n}{2}\right)}{\Gamma \left(\frac{n}{2}\right)}=1 \end{align} よって、確率密度関数の定義を満たしているため、確率密度関数である。 $\blacksquare$
【定理】カイ2乗分布の確率密度関数の導出
【定理】
カイ2乗分布の確率密度関数の導出
Derivation of Chi-squared Distribution
確率変数 $X$ が標準正規分布 \begin{align} X \sim N \left(0,1\right) \end{align} に従うとき、 この確率変数の2乗値 \begin{align} Y=X^2 \end{align} は、 自由度1の $\chi^2$分布 \begin{align} \chi^2 \left(1\right) \end{align} に従う。
導出法:平方変換の公式を用いる方法
標準正規分布の確率密度関数は、 \begin{align} \begin{matrix}f \left(x\right)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}&-\infty \lt x \lt \infty\\\end{matrix} \end{align} 確率変数 $Y=X^2$ の取り得る値の範囲は、 \begin{align} -\infty \lt X \lt \infty\Rightarrow0 \le Y \lt \infty \end{align} 平方変換の公式 $g \left(y\right)=\frac{1}{2\sqrt y} \left\{f \left(\sqrt y\right)+f \left(-\sqrt y\right)\right\}$ より、 \begin{align} g \left(y\right)&=\frac{1}{2\sqrt y} \left(\frac{1}{\sqrt{2\pi}}e^{-\frac{y}{2}}+\frac{1}{\sqrt{2\pi}}e^{-\frac{y}{2}}\right)\\ &=\frac{2}{\sqrt{2\pi}}e^{-\frac{y}{2}} \cdot \frac{1}{2\sqrt y}\\ &=\frac{1}{\sqrt{2\pi}}e^{-\frac{y}{2}} \cdot \frac{1}{\sqrt y} \end{align} これを変形すると、 \begin{align} g \left(y\right)=\frac{1}{2^\frac{1}{2}\sqrt\pi}y^{-\frac{1}{2}}e^{-\frac{y}{2}} \end{align} ガンマ関数の性質 $\Gamma \left(\frac{1}{2}\right)=\sqrt\pi$ より、 \begin{align} g \left(y\right)=\frac{1}{2^\frac{1}{2}\Gamma \left(\frac{1}{2}\right)}y^{-\frac{1}{2}}e^{-\frac{y}{2}} \end{align} これは、$\chi^2$分布の確率密度関数 \begin{align} f \left(x\right)=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} \end{align} において、$n=1$ を代入したものである。 したがって、$Y$ は、自由度1の $\chi^2$分布 \begin{align} \chi^2 \left(1\right) \end{align} に従う。 $\blacksquare$
重要事項のまとめ
略記法
\begin{align} \chi^2 \left(n\right) \end{align}
パラメータ
\begin{gather} n= \left\{1,2, \cdots \right\} \end{gather}
確率密度関数
\begin{align} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}&0 \le x\\0&\mathrm{other}\\\end{matrix}\right.\\ \end{align}
期待値
\begin{align} E \left(X\right)=n \end{align}
分散
\begin{align} V \left(X\right)=2n \end{align}
最頻値
\begin{align} Mo \left(X\right)=n-2 \end{align}
モーメント母関数
\begin{align} \begin{matrix}M_X \left(\theta\right)= \left(\displaystyle\frac{1}{1-2\theta}\right)^\frac{n}{2}&\theta \lt \displaystyle\frac{1}{2}\\\end{matrix} \end{align}
再生性
$\chi^2$分布には、再生性がある。
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.59
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.144-146
- 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.89-90
0 件のコメント:
コメントを投稿