本稿では、大標本における母比率の差の信頼区間を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- $Z_\alpha$ は標準正規分布の上側 $100\alpha\%$ 点を表しています。
データの形式
確率変数 $X,Y$ がそれぞれ独立に二項分布 \begin{align} X \sim \mathrm{B} \left(n_1,p_1\right) \quad Y \sim \mathrm{B} \left(n_2,p_2\right) \end{align} に従い、 それぞれの標本比率を \begin{align} {\hat{p}}_1=\frac{X}{n_1} \quad {\hat{p}}_2=\frac{Y}{n_2} \end{align} とし、 サンプルサイズが十分に大きく、中心極限定理が成り立ち、かつ、母比率が標本比率で近似できる \begin{gather} p_1\cong{\hat{p}}_1 \quad p_2\cong{\hat{p}}_2 \end{gather} とする。
【定理】大標本における母比率の差の信頼区間
【定理】
大標本における母比率の差の信頼区間
Confidence Intervals for Population Proportion Difference with Large-Sample
大標本における母比率の差の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} \left({\hat{p}}_1-{\hat{p}}_2\right)-\hat{\sigma} \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\hat{\sigma} \cdot Z_{0.5\alpha}\\ {\hat{\sigma}}^2=\frac{{\hat{p}}_1 \left(1-{\hat{p}}_1\right)}{n_1}+\frac{{\hat{p}}_2 \left(1-{\hat{p}}_2\right)}{n_2} \end{gather} で与えられる。
導出
二項分布の期待値と分散は、 \begin{gather} E \left(X\right)=n_1p_1 \quad V \left(X\right)=n_1p_1 \left(1-p_1\right)\\ E \left(Y\right)=n_2p_2 \quad V \left(Y\right)=n_2p_2 \left(1-p_2\right) \end{gather} 二項分布の正規近似(中心極限定理)により、 \begin{align} X \sim \mathrm{N} \left\{n_1p_1,n_1p_1 \left(1-p_1\right)\right\} \quad Y \sim \mathrm{N} \left\{n_2p_2,n_2p_2 \left(1-p_2\right)\right\} \end{align} 線形変換の性質より、標本比率 ${\hat{p}}_1,{\hat{p}}_2$ について、 \begin{align} {\hat{p}}_1 \sim \mathrm{N} \left[p_1,\frac{p_1 \left(1-p_1\right)}{n_1}\right] \quad {\hat{p}}_2 \sim \mathrm{N} \left[p_2,\frac{p_2 \left(1-p_2\right)}{n_2}\right] \end{align} 標本比率の差を $\hat{p}={\hat{p}}_1-{\hat{p}}_2$ とすると、正規分布の再生性より、 \begin{align} \hat{p} \sim \mathrm{N} \left[p_1-p_2,\frac{p_1 \left(1-p_1\right)}{n_1}+\frac{p_2 \left(1-p_2\right)}{n_2}\right] \end{align} 母比率の差を $p=p_1-p_2$、標本比率の差 $\hat{p}$ を標準化した値を \begin{gather} Z=\frac{\hat{p}-p}{\sigma}\\ \sigma^2=\frac{p_1 \left(1-p_1\right)}{n_1}+\frac{p_2 \left(1-p_2\right)}{n_2} \end{gather} とすると、 標準化変換の性質より、 \begin{align} Z \sim N \left(0,1\right) \end{align} 標準正規分布の上側 $100\alpha\%$ 点を $Z_\alpha$ とするとき、標準正規分布の対称性から、 \begin{align} P \left(-Z_{0.5\alpha} \le Z \le Z_{0.5\alpha}\right)=1-\alpha \end{align} したがって、母平均の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} -Z_{0.5\alpha} \le \frac{\hat{p}-p}{\sigma} \le Z_{0.5\alpha}\\ \left({\hat{p}}_1-{\hat{p}}_2\right)-\sigma \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\sigma \cdot Z_{0.5\alpha} \end{gather} ここで、母比率が標本比率で近似できる $p_1\cong{\hat{p}}_1,p_2\cong{\hat{p}}_2$ とき、 \begin{align} \left({\hat{p}}_1-{\hat{p}}_2\right)-\hat{\sigma} \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\hat{\sigma} \cdot Z_{0.5\alpha}\\ {\hat{\sigma}}^2=\frac{{\hat{p}}_1 \left(1-{\hat{p}}_1\right)}{n_1}+\frac{{\hat{p}}_2 \left(1-{\hat{p}}_2\right)}{n_2} \end{align} $\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.130-131
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.244
0 件のコメント:
コメントを投稿