本稿では、正規分布の標本平均・標本分散を用いてt統計量・F統計量を導出しています。ここで導出したt統計量・F統計量は信頼区間の導出やt検定・F検定の基礎となります。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【定理】正規分布の標本平均・標本分散とt統計量
【定理】
正規分布の標本平均・標本分散とt統計量
Sample Mean and Variance of Normal Distributions and t-Statistic
正規分布 $\mathrm{N} \left(\mu,\sigma^2\right)$ からの大きさ $n$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} とし、 標本平均と標本不偏分散をそれぞれ、 \begin{align} \bar{X}=\sum_{i=1}^{n}X_i \quad s^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2 \end{align} とするとき、 次の統計量は、$\mathrm{t}$分布 \begin{align} t=\frac{\sqrt n \left(\bar{X}-\mu\right)}{s} \sim \mathrm{t} \left(n-1\right) \end{align} に従う。
証明
正規分布の標本平均を標準化した値は、 \begin{align} Z=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sigma} \sim \mathrm{N} \left(0,1\right) \end{align} 正規分布の標本平均と標本分散の性質より、次の値は標本平均と独立に \begin{align} W=\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2} \sim \chi^2 \left(n-1\right) \end{align} これを、標本不偏分散を用いて表すと、 \begin{align} s^2&=\frac{\sigma^2}{n-1}\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2}\\ &=\frac{\sigma^2}{n-1}W \end{align} これを $\mathrm{t}$ 統計量の定義式に代入すると、 \begin{align} t&=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sqrt{\frac{\sigma^2}{n-1}W}}\\ &=\frac{\sqrt n \left(\bar{X}-\mu\right)}{\sigma} \cdot \frac{\sqrt{n-1}}{\sqrt W}\\ &=\frac{Z\sqrt{n-1}}{\sqrt W} \end{align} したがって、$\mathrm{t}$ 分布の定義より、 \begin{align} t \sim \mathrm{t} \left(n-1\right) \end{align} $\blacksquare$
【定理】正規分布の標本平均・標本分散とt統計量・F統計量
【定理】
正規分布の標本平均・標本分散とt統計量・F統計量
Sample Mean and Variance of Normal Distributions and t-Statistic and F-Statistic
正規分布 $\mathrm{N} \left(\mu_1,\sigma^2\right),\mathrm{N} \left(\mu_2,\sigma^2\right)$ からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots ,Y_m\right\} \end{align} とし、 それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\sum_{i=1}^{n}X_i \quad s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\\ \bar{Y}=\sum_{i=1}^{m}Y_i \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right)^2 \end{gather} とするとき、 (i)次の統計量は、$\mathrm{t}$分布 \begin{gather} t=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{s\sqrt{\frac{1}{n}+\frac{1}{m}}} \sim \mathrm{t} \left(n+m-2\right)\\ s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{gather} に従う。 (ii)次の統計量は、$\mathrm{F}$分布 \begin{gather} F=\frac{s_X^2}{s_Y^2} \sim \mathrm{F} \left(n-1,m-1\right)\\ \end{gather} に従う。
証明
(i)正規分布の標本平均の分布は、 \begin{align} \bar{X} \sim \mathrm{N} \left(\mu_1,\frac{\sigma^2}{n}\right) \quad \bar{Y} \sim \mathrm{N} \left(\mu_2,\frac{\sigma^2}{m}\right) \end{align} 正規分布の再生性より、標本平均の差の分布は、 \begin{align} \bar{X}-\bar{Y} \sim \mathrm{N} \left(\mu_1-\mu_2,\frac{\sigma^2}{n}+\frac{\sigma^2}{m}\right) \end{align} 正規分布の標本平均の差を標準化した値を \begin{align} Z=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sigma\sqrt{\frac{1}{n}+\frac{1}{m}}} \end{align} とすると、 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} いっぽう、正規分布の標本平均と標本分散の性質より、次の値はそれぞれの標本平均と独立に \begin{align} W_1=\sum_{i=1}^{n}\frac{ \left(X_i-\bar{X}\right)^2}{\sigma^2} \sim \chi^2 \left(n-1\right) \quad W_2=\sum_{i=1}^{m}\frac{ \left(Y_i-\bar{Y}\right)^2}{\sigma^2} \sim \chi^2 \left(m-1\right) \end{align} これらを、標本不偏分散を用いて表すと、 \begin{align} W_1=\frac{ \left(n-1\right)s_X^2}{\sigma^2} \quad W_2=\frac{ \left(m-1\right)s_Y^2}{\sigma^2}\tag{1} \end{align} $\chi^2$ 分布の再生性より、 \begin{gather} W=W_1+W_2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{\sigma^2}\\ W \sim \chi^2 \left(n+m-2\right) \end{gather} これを $\mathrm{t}$ 統計量の定義式に代入すると、 \begin{align} t&=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sigma\sqrt{\frac{1}{n}+\frac{1}{m}}} \cdot \frac{1}{\sqrt{\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{\sigma^2 \left(n+m-2\right)}}}\\ &=\frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_1-\mu_2\right)}{\sqrt{\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{ \left(n+m-2\right)}}\sqrt{\frac{1}{n}+\frac{1}{m}}} \cdot \\ &=\frac{Z\sqrt{n+m-2}}{\sqrt W} \end{align} したがって、$\mathrm{t}$ 分布の定義より、 \begin{align} t \sim \mathrm{t} \left(n+m-2\right) \end{align} $\blacksquare$ (ii)また、式 $(1)$ より、 \begin{align} \frac{W_1}{n-1}=\frac{s_X^2}{\sigma^2} \quad \frac{W_2}{m-1}=\frac{s_Y^2}{\sigma^2} \end{align} これを $\mathrm{F}$ 統計量の定義式に代入すると、 \begin{align} F&=\frac{\frac{W_1}{n-1}}{\frac{W_2}{m-1}}\\ &=\frac{\frac{s_X^2}{\sigma^2}}{\frac{s_Y^2}{\sigma^2}}\\ &=\frac{s_X^2}{s_Y^2} \end{align} したがって、$\mathrm{F}$ 分布の定義より、 \begin{gather} F=\frac{s_X^2}{s_Y^2} \sim \mathrm{F} \left(n-1,m-1\right)\\ \end{gather} $\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.179-180
0 件のコメント:
コメントを投稿