本稿では、正規分布の標本平均と標本分散が独立であり、標本分散がカイ2乗分布に従うことを証明しています。この事実は推定や検定を考えるうえで非常に重要で、教科書などでは、結果のみが掲載されていますが、その証明は意外と難しく、中級者向けの内容となります。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【命題】独立正規標本の直交変換
【命題】
独立正規標本の直交変換
Orthogonal Transformation of Independent Normal Random Variables
標準正規分布 $\mathrm{N} \left(0,1\right)$ からの大きさ $n$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} とするとき、 任意の直交行列 $\boldsymbol{T}$ を用いて \begin{gather} \boldsymbol{X}=\boldsymbol{TY}\\ \left\{\begin{matrix}X_1\\X_2\\\vdots\\X_n\\\end{matrix}\right\}=\boldsymbol{T} \left\{\begin{matrix}Y_1\\Y_2\\\vdots\\Y_n\\\end{matrix}\right\} \end{gather} と変数変換すると、 \begin{align} \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots ,Y_n\right\} \end{align} は互いに独立に 標準正規分布 \begin{align} Y_i \sim \mathrm{N} \left(0,1\right) \end{align} に従う。
証明
$\boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\}$ の同時確率密度関数は、 \begin{align} f \left(\boldsymbol{x}\right)&=\prod_{i=1}^{n}{\frac{1}{\sqrt{2\pi}}\mathrm{exp} \left(-\frac{x_i^2}{2}\right)}\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2}\sum_{i=1}^{n}x_i^2\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^ne^{-\frac{1}{2} \left(x_1^2+x_2^2+ \cdots +x_n^2\right)} \end{align} 行列を用いて表すと、 \begin{align} f \left(\boldsymbol{x}\right)= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2}\boldsymbol{x}^\boldsymbol{t}\boldsymbol{x}\right) \end{align} ここで、任意の直交行列 $\boldsymbol{T}$ を用いた変数変換 \begin{gather} \boldsymbol{x}=\boldsymbol{Ty} \end{gather} を考えると、 変数変換後の同時確率密度関数の公式 \begin{align} g \left(\boldsymbol{y}\right)=f \left(\boldsymbol{A}^{-\boldsymbol{1}}\boldsymbol{y}\right) \left|\boldsymbol{A}\right| \end{align} より、 $\boldsymbol{y}= \left\{y_1,y_2, \cdots ,y_n\right\}$ の同時確率密度関数は、 \begin{align} g \left(\boldsymbol{y}\right)=f \left(\boldsymbol{T}^{-\boldsymbol{1}}\boldsymbol{y}\right) \left|\boldsymbol{T}\right| \end{align} ここで、直交行列の逆行列はその行列の転置行列であることから、 \begin{align} \boldsymbol{T}^{-\boldsymbol{1}}=\boldsymbol{T}^\boldsymbol{t} \end{align} また、 \begin{align} \left|\boldsymbol{I}\right|= \left|\boldsymbol{T}^\boldsymbol{t}\boldsymbol{T}\right|= \left|\boldsymbol{T}\right|^\boldsymbol{2}=1 \end{align} したがって、 \begin{align} g \left(\boldsymbol{y}\right)&=f \left(\boldsymbol{T}^\boldsymbol{t}\boldsymbol{y}\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2} \left(\boldsymbol{T}^\boldsymbol{t}\boldsymbol{y}\right)^\boldsymbol{t} \left(\boldsymbol{T}^\boldsymbol{t}\boldsymbol{y}\right)\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2}\boldsymbol{y}^\boldsymbol{t}\boldsymbol{T}\boldsymbol{T}^\boldsymbol{t}\boldsymbol{y}\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2}\boldsymbol{y}^\boldsymbol{t}\boldsymbol{Iy}\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^n\mathrm{exp} \left(-\frac{1}{2}\boldsymbol{y}^\boldsymbol{t}\boldsymbol{y}\right)\\ &= \left(\frac{1}{\sqrt{2\pi}}\right)^ne^{-\frac{1}{2} \left(y_1^2+y_2^2+ \cdots +y_n^2\right)} \end{align} これは、標準正規分布の同時確率密度関数であり、独立性の定義を満たしているため、 \begin{align} \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots ,Y_n\right\} \end{align} は互いに独立に 標準正規分布 \begin{align} Y_i \sim \mathrm{N} \left(0,1\right) \end{align} に従う。 $\blacksquare$
【定理】正規分布の標本平均と標本分散の独立性
【定理】
正規分布の標本平均と標本分散の独立性
Independence of the Sample Mean and Variance for Normal Distributions
正規分布 $\mathrm{N} \left(\mu,\sigma^2\right)$ からの大きさ $n$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} とし、 標本平均と標本分散をそれぞれ、 \begin{align} \bar{X}=\sum_{i=1}^{n}X_i \quad S^2=\frac{1}{n}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2 \end{align} とするとき、以下が成り立つ。 (i) $\bar{X}$ と $S^2$ は互いに独立である。 (ii) \begin{align} \sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2}=\frac{nS^2}{\sigma^2} \end{align} は、自由度 $n-1$ の $\chi^2$分布 $\chi^2 \left(n-1\right)$ に従う。
証明
$Z_i=\frac{X_i-\mu}{\sigma}$ と標準化すると、正規分布の標準化の性質より、
\begin{align}
Z_i \sim \mathrm{N} \left(0,1\right)
\end{align}
また、証明したい命題は、
(i)$\bar{Z}$ と $\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2$ は互いに独立である。
(ii)
\begin{align}
\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2 \sim \chi^2 \left(n-1\right)
\end{align}
と書き直すことができる(上記と同義である)。
ここで、$\boldsymbol{H}$ を最初の行が $ \left(\frac{1}{\sqrt n},\frac{1}{\sqrt n}, \cdots ,\frac{1}{\sqrt n}\right)$ であるような直交行列、例えば、
\begin{align}
\boldsymbol{H}= \left(\begin{matrix}\frac{1}{\sqrt n}&\frac{1}{\sqrt n}&\frac{1}{\sqrt n}& \cdots &\frac{1}{\sqrt n}\\-\frac{1}{\sqrt2}&\frac{1}{\sqrt2}&0& \cdots &0\\-\frac{1}{\sqrt{2 \cdot 3}}&-\frac{1}{\sqrt{2 \cdot 3}}&\frac{2}{\sqrt{2 \cdot 3}}& \cdots &0\\\vdots&\vdots&\vdots&\ddots&\vdots\\-\frac{1}{\sqrt{n \left(n-1\right)}}&-\frac{1}{\sqrt{n \left(n-1\right)}}&-\frac{1}{\sqrt{n \left(n-1\right)}}& \cdots &-\frac{n-1}{\sqrt{n \left(n-1\right)}}\\\end{matrix}\right)
\end{align}
として、
\begin{gather}
\boldsymbol{Y}=\boldsymbol{HZ}\\
\end{gather}
と変数変換すると、
独立正規標本の直交変換の性質より、
\begin{align}
Y_i \sim \mathrm{N} \left(0,1\right)
\end{align}
また、変数変換の中身を計算すると、
\begin{gather}
Y_1=\frac{1}{\sqrt n}\sum_{i=1}^{n}Z_i=\frac{n}{\sqrt n} \cdot \frac{1}{n}\sum_{i=1}^{n}Z_i=\sqrt n\bar{Z}\\
Y_1^2=n{\bar{Z}}^2
\end{gather}
ここで、恒等式
\begin{align}
\sum_{i=1}^{n}Z_i^2=n{\bar{Z}}^2+\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2
\end{align}
より、
直交変換 $\boldsymbol{Y}=\boldsymbol{HZ}$ によって、
\begin{align}
Z_1^2+Z_2^2+ \cdots +Z_n^2=n{\bar{Z}}^2+\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2\\
\Rightarrow Y_1^2+Y_2^2+ \cdots +Y_n^2=Y_1^2+\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2
\end{align}
と変数変換される。
したがって、
\begin{align}
\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2=Y_2^2+ \cdots +Y_n^2=\sum_{i=2}^{n}Y_i^2
\end{align}
ところで、$Y_i$ は互いに独立であるから、その関数である
$Y_1^2 \quad $ と $ \quad Y_2^2+ \cdots +Y_n^2$
もまた、互いに独立である。
したがって、
$n{\bar{Z}}^2 \quad $ と $ \quad \sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2$
は、互いに独立で、
これらの関数である
$\bar{Z} \quad $ と $ \quad S^2=\frac{1}{n}\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2$
は、互いに独立である。
また、$\chi^2$分布の定義より、
\begin{align}
\sum_{i=1}^{n} \left(Z_i-\bar{Z}\right)^2 \sim \chi^2 \left(n-1\right)
\end{align}
$\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.97-99
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.177-179
- 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.94-96
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.87-88
0 件のコメント:
コメントを投稿