正規分布の標本平均・標本分散とt統計量・F統計量の導出

公開日: 更新日:

【2023年4月2週】 【B000】数理統計学 【B060】標本分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、正規分布の標本平均・標本分散を用いてt統計量・F統計量を導出しています。ここで導出したt統計量・F統計量は信頼区間の導出やt検定・F検定の基礎となります。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

【定理】正規分布の標本平均・標本分散とt統計量

【定理】
正規分布の標本平均・標本分散とt統計量
Sample Mean and Variance of Normal Distributions and t-Statistic

正規分布 $\mathrm{N} \left(\mu,\sigma^2\right)$ からの大きさ $n$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} とし、 標本平均と標本不偏分散をそれぞれ、 \begin{align} \bar{X}=\sum_{i=1}^{n}X_i \quad s^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2 \end{align} とするとき、 次の統計量は、$\mathrm{t}$分布 \begin{align} t=\frac{\sqrt n \left(\bar{X}-\mu\right)}{s} \sim \mathrm{t} \left(n-1\right) \end{align} に従う。

証明

証明

正規分布の標本平均を標準化した値は、 \begin{align} Z=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sigma} \sim \mathrm{N} \left(0,1\right) \end{align} 正規分布の標本平均と標本分散の性質より、次の値は標本平均と独立に \begin{align} W=\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2} \sim \chi^2 \left(n-1\right) \end{align} これを、標本不偏分散を用いて表すと、 \begin{align} s^2&=\frac{\sigma^2}{n-1}\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2}\\ &=\frac{\sigma^2}{n-1}W \end{align} これを $\mathrm{t}$ 統計量の定義式に代入すると、 \begin{align} t&=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sqrt{\frac{\sigma^2}{n-1}W}}\\ &=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sigma} \cdot \frac{\sqrt{n-1}}{\sqrt W}\\ &=\frac{Z\sqrt{n-1}}{\sqrt W} \end{align} したがって、$\mathrm{t}$ 分布の定義より、 \begin{align} t \sim \mathrm{t} \left(n-1\right) \end{align} $\blacksquare$

【定理】正規分布の標本平均・標本分散とt統計量・F統計量

【定理】
正規分布の標本平均・標本分散とt統計量・F統計量
Sample Mean and Variance of Normal Distributions and t-Statistic and F-Statistic

正規分布 $\mathrm{N} \left(\mu_1,\sigma^2\right),\mathrm{N} \left(\mu_2,\sigma^2\right)$ からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots ,Y_m\right\} \end{align} とし、 それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\sum_{i=1}^{n}X_i \quad s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\\ \bar{Y}=\sum_{i=1}^{m}Y_i \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right)^2 \end{gather} とするとき、 (i)次の統計量は、$\mathrm{t}$分布 \begin{gather} t=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{s\sqrt{\frac{1}{n}+\frac{1}{m}}} \sim \mathrm{t} \left(n+m-2\right)\\ s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{gather} に従う。 (ii)次の統計量は、$\mathrm{F}$分布 \begin{gather} F=\frac{s_X^2}{s_Y^2} \sim \mathrm{F} \left(n-1,m-1\right)\\ \end{gather} に従う。

証明

証明

(i)正規分布の標本平均の分布は、 \begin{align} \bar{X} \sim \mathrm{N} \left(\mu_1,\frac{\sigma^2}{n}\right) \quad \bar{Y} \sim \mathrm{N} \left(\mu_2,\frac{\sigma^2}{m}\right) \end{align} 正規分布の再生性より、標本平均の差の分布は、 \begin{align} \bar{X}-\bar{Y} \sim \mathrm{N} \left(\mu_1-\mu_2,\frac{\sigma^2}{n}+\frac{\sigma^2}{m}\right) \end{align} 正規分布の標本平均の差を標準化した値を \begin{align} Z=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sigma\sqrt{\frac{1}{n}+\frac{1}{m}}} \end{align} とすると、 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} いっぽう、正規分布の標本平均と標本分散の性質より、次の値はそれぞれの標本平均と独立に \begin{align} W_1=\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2} \sim \chi^2 \left(n-1\right) \quad W_2=\sum_{i=1}^{m}\frac{ \left(Y_i-\bar{Y}\right)^2}{\sigma^2} \sim \chi^2 \left(m-1\right) \end{align} これらを、標本不偏分散を用いて表すと、 \begin{align} W_1=\frac{ \left(n-1\right)s_X^2}{\sigma^2} \quad W_2=\frac{ \left(m-1\right)s_Y^2}{\sigma^2}\tag{1} \end{align} $\chi^2$ 分布の再生性より、 \begin{gather} W=W_1+W_2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{\sigma^2}\\ W \sim \chi^2 \left(n+m-2\right) \end{gather} これを $\mathrm{t}$ 統計量の定義式に代入すると、 \begin{align} t&=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sigma\sqrt{\frac{1}{n}+\frac{1}{m}}} \cdot \frac{1}{\sqrt{\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{\sigma^2 \left(n+m-2\right)}}}\\ &=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sqrt{\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{ \left(n+m-2\right)}}\sqrt{\frac{1}{n}+\frac{1}{m}}} \cdot \\ &=\frac{Z\sqrt{n+m-2}}{\sqrt W} \end{align} したがって、$\mathrm{t}$ 分布の定義より、 \begin{align} t \sim \mathrm{t} \left(n+m-2\right) \end{align} $\blacksquare$ (ii)また、式 $(1)$ より、 \begin{align} \frac{W_1}{n-1}=\frac{s_X^2}{\sigma^2} \quad \frac{W_2}{m-1}=\frac{s_Y^2}{\sigma^2} \end{align} これを $\mathrm{F}$ 統計量の定義式に代入すると、 \begin{align} F&=\frac{\frac{W_1}{n-1}}{\frac{W_2}{m-1}}\\ &=\frac{\frac{s_X^2}{\sigma^2}}{\frac{s_Y^2}{\sigma^2}}\\ &=\frac{s_X^2}{s_Y^2} \end{align} したがって、$\mathrm{F}$ 分布の定義より、 \begin{gather} F=\frac{s_X^2}{s_Y^2} \sim \mathrm{F} \left(n-1,m-1\right)\\ \end{gather} $\blacksquare$

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.179-180

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ