本稿では、大標本における母平均の差の信頼区間を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- $Z_\alpha$ は標準正規分布の上側 $100\alpha\%$ 点を表しています。
データの形式
確率変数 $X,Y$ が互いに独立に、それぞれ平均が $\mu_X,\mu_Y$、分散が $\sigma_X^2,\sigma_Y^2$ である任意の確率分布 \begin{align} {\mathrm{P}}_X \left(\mu_X,\sigma_X^2\right) \quad {\mathrm{P}}_Y \left(\mu_Y,\sigma_Y^2\right) \end{align} に従い、 この分布からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots Y_m\right\} \end{align} それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \quad \bar{Y}=\frac{1}{m}\sum_{i=1}^{n}Y_i\\ s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right) \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right) \end{gather} とし、 サンプルサイズが十分に大きく、中心極限定理が成り立ち、かつ、母分散が標本不偏分散で近似できる \begin{gather} \sigma_X^2\cong s_X^2 \quad \sigma_Y^2\cong s_Y^2 \end{gather} とする。
【定理】大標本における母平均の差の信頼区間
【定理】
大標本における母平均の差の信頼区間
Confidence Intervals for Population Mean Difference of Any Distributions with Large-Sample
大標本における母平均の差の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} \left(\bar{X}-\bar{Y}\right)-\phi \cdot Z_{0.5\alpha} \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\phi \cdot Z_{0.5\alpha}\\ \phi^2=\frac{s_X^2}{n}+\frac{s_Y^2}{m} \end{gather} で与えられる。
導出
中心極限定理により、標本平均 $\bar{X},\bar{Y}$ について、 \begin{align} \bar{X} \sim N \left(\mu_X,\frac{\sigma_X^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{\sigma_Y^2}{m}\right) \end{align} 母分散が標本不偏分散で近似できる $\sigma_X^2\cong s_X^2,\sigma_Y^2\cong s_Y^2$ とき、 \begin{align} \bar{X} \sim N \left(\mu_X,\frac{s_X^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{s_Y^2}{m}\right) \end{align} 標本平均の差を $\bar{d}=\bar{X}-\bar{Y}$ とすると、正規分布の再生性により、 \begin{align} \bar{d} \sim N \left(\mu_X-\mu_Y,\frac{s_X^2}{n}+\frac{s_Y^2}{m}\right) \end{align} 母平均の差を $d=\mu_X-\mu_Y$、標本平均の差 $\bar{d}$ を標準化した値を \begin{gather} Z=\frac{\bar{d}-d}{\phi}\\ \phi^2=\frac{s_X^2}{n}+\frac{s_Y^2}{m} \end{gather} とすると、 標準化変換の性質より、 \begin{align} Z \sim N \left(0,1\right) \end{align} 標準正規分布の対称性から、 \begin{align} P \left(-Z_{0.5\alpha} \le Z \le Z_{0.5\alpha}\right)=1-\alpha \end{align} したがって、母平均の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} -Z_{0.5\alpha} \le \frac{\bar{d}-d}{\phi} \le Z_{0.5\alpha}\\ \left(\bar{X}-\bar{Y}\right)-\phi \cdot Z_{0.5\alpha} \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\phi \cdot Z_{0.5\alpha} \end{gather} $\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.129-130
0 件のコメント:
コメントを投稿