大標本における母比率の差の信頼区間の導出

公開日: 更新日:

【2023年4月4週】 【B000】数理統計学 【B070】統計的推定

この記事をシェアする
  • B!
サムネイル画像

本稿では、大標本における母比率の差の信頼区間を導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • $Z_\alpha$ は標準正規分布の上側 $100\alpha\%$ 点を表しています。

データの形式

確率変数 $X,Y$ がそれぞれ独立に二項分布 \begin{align} X \sim \mathrm{B} \left(n_1,p_1\right) \quad Y \sim \mathrm{B} \left(n_2,p_2\right) \end{align} に従い、 それぞれの標本比率を \begin{align} {\hat{p}}_1=\frac{X}{n_1} \quad {\hat{p}}_2=\frac{Y}{n_2} \end{align} とし、 サンプルサイズが十分に大きく、中心極限定理が成り立ち、かつ、母比率が標本比率で近似できる \begin{gather} p_1\cong{\hat{p}}_1 \quad p_2\cong{\hat{p}}_2 \end{gather} とする。

【定理】大標本における母比率の差の信頼区間

【定理】
大標本における母比率の差の信頼区間
Confidence Intervals for Population Proportion Difference with Large-Sample

大標本における母比率の差の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} \left({\hat{p}}_1-{\hat{p}}_2\right)-\hat{\sigma} \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\hat{\sigma} \cdot Z_{0.5\alpha}\\ {\hat{\sigma}}^2=\frac{{\hat{p}}_1 \left(1-{\hat{p}}_1\right)}{n_1}+\frac{{\hat{p}}_2 \left(1-{\hat{p}}_2\right)}{n_2} \end{gather} で与えられる。

導出

導出

二項分布の期待値と分散は、 \begin{gather} E \left(X\right)=n_1p_1 \quad V \left(X\right)=n_1p_1 \left(1-p_1\right)\\ E \left(Y\right)=n_2p_2 \quad V \left(Y\right)=n_2p_2 \left(1-p_2\right) \end{gather} 二項分布の正規近似(中心極限定理)により、 \begin{align} X \sim \mathrm{N} \left\{n_1p_1,n_1p_1 \left(1-p_1\right)\right\} \quad Y \sim \mathrm{N} \left\{n_2p_2,n_2p_2 \left(1-p_2\right)\right\} \end{align} 線形変換の性質より、標本比率 ${\hat{p}}_1,{\hat{p}}_2$ について、 \begin{align} {\hat{p}}_1 \sim \mathrm{N} \left[p_1,\frac{p_1 \left(1-p_1\right)}{n_1}\right] \quad {\hat{p}}_2 \sim \mathrm{N} \left[p_2,\frac{p_2 \left(1-p_2\right)}{n_2}\right] \end{align} 標本比率の差を $\hat{p}={\hat{p}}_1-{\hat{p}}_2$ とすると、正規分布の再生性より、 \begin{align} \hat{p} \sim \mathrm{N} \left[p_1-p_2,\frac{p_1 \left(1-p_1\right)}{n_1}+\frac{p_2 \left(1-p_2\right)}{n_2}\right] \end{align} 母比率の差を $p=p_1-p_2$、標本比率の差 $\hat{p}$ を標準化した値を \begin{gather} Z=\frac{\hat{p}-p}{\sigma}\\ \sigma^2=\frac{p_1 \left(1-p_1\right)}{n_1}+\frac{p_2 \left(1-p_2\right)}{n_2} \end{gather} とすると、 標準化変換の性質より、 \begin{align} Z \sim N \left(0,1\right) \end{align} 標準正規分布の上側 $100\alpha\%$ 点を $Z_\alpha$ とするとき、標準正規分布の対称性から、 \begin{align} P \left(-Z_{0.5\alpha} \le Z \le Z_{0.5\alpha}\right)=1-\alpha \end{align} したがって、母平均の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} -Z_{0.5\alpha} \le \frac{\hat{p}-p}{\sigma} \le Z_{0.5\alpha}\\ \left({\hat{p}}_1-{\hat{p}}_2\right)-\sigma \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\sigma \cdot Z_{0.5\alpha} \end{gather} ここで、母比率が標本比率で近似できる $p_1\cong{\hat{p}}_1,p_2\cong{\hat{p}}_2$ とき、 \begin{align} \left({\hat{p}}_1-{\hat{p}}_2\right)-\hat{\sigma} \cdot Z_{0.5\alpha} \le p_1-p_2 \le \left({\hat{p}}_1-{\hat{p}}_2\right)+\hat{\sigma} \cdot Z_{0.5\alpha}\\ {\hat{\sigma}}^2=\frac{{\hat{p}}_1 \left(1-{\hat{p}}_1\right)}{n_1}+\frac{{\hat{p}}_2 \left(1-{\hat{p}}_2\right)}{n_2} \end{align} $\blacksquare$

参考文献

  • 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.130-131
  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.244

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ