本稿では、連続値データの標本平均の漸近分布の導出を行っています。母集団の分布が正規分布でなくとも、サンプルサイズが十分に大きければ、中心極限定理により標本平均の分布は正規分布になるという事実は、統計学的推定や検定を考えるうえで非常に重要です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
【定理】標本平均の差の漸近分布
【定理】
標本平均の差の漸近分布
Asymptotic Distribution of Sample Mean Difference
対応のない連続値データに関するコホート研究・介入研究について、
帰無仮説と対立仮説をそれぞれ
\begin{gather}
H_0:\mu_X=\mu_Y \quad H_1:\mu_X \neq \mu_Y
\end{gather}
とするとき、
標本平均の差の漸近分布は、
〔1〕対立仮説
\begin{align}
H_1:\bar{X}-\bar{Y}\xrightarrow[]{d}\mathrm{N} \left(\mu_X-\mu_Y,\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}\right)
\end{align}
〔2〕帰無仮説
\begin{align}
H_0:\bar{X}-\bar{Y}\xrightarrow[]{d}\mathrm{N} \left(0,\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}\right)
\end{align}
各群の標本不偏分散がそれぞれの母分散の一致推定量とみなすことができる、すなわち、
\begin{gather}
s_X^2=\sigma_X^2 \quad s_Y^2=\sigma_Y^2
\end{gather}
とするとき、
両仮説における標本平均の差の漸近分散の一致推定量は、
\begin{align}
{\hat{\sigma}}_1^2={\hat{\sigma}}_0^2=\frac{s_X^2}{n}+\frac{s_Y^2}{m}
\end{align}
導出
中心極限定理より、標本平均の漸近分布は、 \begin{align} \bar{X}\xrightarrow[]{d}\mathrm{N} \left(\mu_X,\frac{\sigma_X^2}{n}\right)\\ \bar{Y}\xrightarrow[]{d}\mathrm{N} \left(\mu_Y,\frac{\sigma_Y^2}{m}\right) \end{align} 正規分布の再生性より、 \begin{align} \bar{X}-\bar{Y}\xrightarrow[]{d}\mathrm{N} \left(\mu_X-\mu_Y,\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}\right) \end{align} 帰無仮説の下では、 \begin{gather} \bar{X}-\bar{Y}\xrightarrow[]{d}\mathrm{N} \left(0,\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}\right) \end{gather} 各群の標本不偏分散がそれぞれの母分散の一致推定量とみなすことができるとき、両仮説における標本平均の差の漸近分散の一致推定量は、 \begin{align} {\hat{\sigma}}_1^2={\hat{\sigma}}_0^2=\frac{s_X^2}{n}+\frac{s_Y^2}{m} \end{align} $\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.243
0 件のコメント:
コメントを投稿