本稿では、大標本における母比率の差に関する検定を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- $Z_\alpha$ は標準正規分布の上側 $100\alpha\%$ 点を表しています。
データの形式
確率変数 $X,Y$ が互いに独立に二項分布 \begin{align} \mathrm{B} \left(n_1,p_1\right),\mathrm{B} \left(n_2,p_2\right) \end{align} に従い、 標本比率を \begin{align} {\hat{p}}_1=\frac{X}{n_1} \quad {\hat{p}}_2=\frac{Y}{n_2} \end{align} 共通の標本比率を \begin{align} \hat{p}=\frac{n_1{\hat{p}}_1+n_2{\hat{p}}_2}{n_1+n_2} \end{align} とし、 サンプルサイズが十分に大きく、中心極限定理が成り立ち、かつ、母比率が標本比率で近似できる \begin{gather} p_1\cong{\hat{p}}_1 \quad p_2\cong{\hat{p}}_2 \end{gather} とする。
【定理】大標本における母比率の差に関する検定
【定理】
大標本における母比率の差に関する検定
Population Proportion Difference with Large-Sample
大標本における母比率の差に関する検定問題
(I)両側検定
\begin{align}
H_0:p_1=p_2 \quad H_1:p_1 \neq p_2
\end{align}
(II-A)片側検定A
\begin{align}
H_0:p_1 \le p_2 \quad H_1:p_1 \gt p_2
\end{align}
(II-B)片側検定B
\begin{align}
H_0:p_1 \geq p_2 \quad H_1:p_1 \lt p_2
\end{align}
を考える場合、
検定統計量を
\begin{gather}
Z_0=\frac{{\hat{p}}_1-{\hat{p}}_2}{\hat{\sigma}}\\
{\hat{\sigma}}^2=\hat{p} \left(1-\hat{p}\right) \left(\frac{1}{n_1}+\frac{1}{n_2}\right)
\end{gather}
として、
(I)両側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-Z_{0.5\alpha} \le Z_0 \le Z_{0.5\alpha}&\mathrm{0:Hold\ }H_0\\Z_0 \le -Z_{0.5\alpha} \quad \mathrm{or} \quad Z_{0.5\alpha} \le Z_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II)片側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力検定となる。
(II-A)片側検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}Z_0 \lt Z_\alpha&\mathrm{0:Hold\ }H_0\\Z_\alpha \le Z_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-Z_\alpha \lt Z_0&\mathrm{0:Hold\ }H_0\\Z_0 \le -Z_\alpha&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
Step.1 尤度比の算出
二項分布の最尤推定量は、 \begin{align} {\hat{p}}_1=\frac{X}{n_1} \quad {\hat{p}}_2=\frac{Y}{n_2} \end{align} 帰無仮説における共通の母比率を $H_0:p_1=p_2=p$ として、両仮説の尤度比 $\lambda$ を計算すると(算出過程は省略)、 \begin{align} \lambda&=\frac{L \left(p_1=p,p_2=p;x,y\right)}{L \left(p_1={\hat{p}}_1,p_2={\hat{p}}_2;x,y\right)}\\ &=\frac{f \left(x;p_1=p\right) \cdot f \left(y;p_2=p\right)}{f \left(x;p_1={\hat{p}}_1\right) \cdot f \left(y;p_2={\hat{p}}_2\right)}= \cdots \\ &=h \left({\hat{p}}_1-{\hat{p}}_2\right) \end{align} したがって、検定統計量 $T \left(X,Y\right)=\frac{X}{n_1}-\frac{Y}{n_2}$ が考えられる。
Step.2 検定統計量の対立仮説・帰無仮説における分布
(i)対立仮説における分布
標本比率の漸近分布は、
\begin{align}
{\hat{p}}_i \sim \mathrm{N} \left[p_i,\frac{p_i \left(1-p_i\right)}{n_i}\right] \quad i=1,2
\end{align}
正規分布の再生性より、標本比率の差 $\hat{d}={\hat{p}}_1-{\hat{p}}_2$ の漸近分布は、
\begin{align}
\hat{d} \sim \mathrm{N} \left\{p_1-p_2,\frac{p_1 \left(1-p_1\right)}{n_1}+\frac{p_2 \left(1-p_2\right)}{n_2}\right\}
\end{align}
母比率が標本比率で近似できるとき、
\begin{align}
\hat{d} \sim \mathrm{N} \left\{p_1-p_2,\frac{{\hat{p}}_1 \left(1-{\hat{p}}_1\right)}{n_1}+\frac{{\hat{p}}_2 \left(1-{\hat{p}}_2\right)}{n_2}\right\}
\end{align}
(ii)帰無仮説における分布
帰無仮説 $H_0:p_1=p_2=p$ における共通の母比率の最尤推定量は、
\begin{align}
\hat{p}=\frac{n_1{\hat{p}}_1+n_2{\hat{p}}_2}{n_1+n_2}
\end{align}
よって、帰無仮説における標本比率の差の漸近分布は、
\begin{align}
\hat{d} \sim \mathrm{N} \left\{0,\frac{\hat{p} \left(1-\hat{p}\right)}{n_1}+\frac{\hat{p} \left(1-\hat{p}\right)}{n_2}\right\}
\end{align}
帰無仮説において、標本比率の差 $\hat{d}$ を標準化した値を
\begin{gather}
Z_0=\frac{{\hat{p}}_1-{\hat{p}}_2}{\hat{\sigma}}\\
{\hat{\sigma}}^2=\hat{p} \left(1-\hat{p}\right) \left(\frac{1}{n_1}+\frac{1}{n_2}\right)
\end{gather}
とすると、
標準化変換の性質より、
\begin{align}
Z_0 \sim N \left(0,1\right)
\end{align}
Step.3 検定関数と棄却域の型
(I)両側検定
ネイマン・ピアソンの基本定理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}a \le T \left(\boldsymbol{X}\right) \le b&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \lt a \quad \mathrm{or} \quad b \lt T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{1}
\end{align}
(II)片側検定
ネイマン・ピアソンの基本定理と単調尤度比の原理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力検定となる。
検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}T \left(\boldsymbol{X}\right) \lt a&\mathrm{0:Hold\ }H_0\\a \le T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{2}
\end{align}
検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}b \lt T \left(\boldsymbol{X}\right)&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \le b&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{3}
\end{align}
Step.4 棄却域の設定
(I)両側検定
パーセント点の定義と標準正規分布の対称性から、
\begin{align}
P \left(-Z_{0.5\alpha} \le Z_0 \le Z_{0.5\alpha}\right)=1-\alpha
\end{align}
したがって、式 $(1)$ において、$a=-Z_{0.5\alpha},b=Z_{0.5\alpha}$ とすると、
\begin{gather}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-Z_{0.5\alpha} \le Z_0 \le Z_{0.5\alpha}&\mathrm{0:Hold\ }H_0\\Z_0 \le -Z_{0.5\alpha} \quad \mathrm{or} \quad Z_{0.5\alpha} \le Z_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\\
\end{gather}
(II-A)片側検定A
パーセント点の定義より、
\begin{align}
P \left(Z_0 \le Z_\alpha\right)=1-\alpha
\end{align}
したがって、式 $(2)$ において、$a=Z_\alpha$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}Z_0 \lt Z_\alpha&\mathrm{0:Hold\ }H_0\\Z_\alpha \le Z_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
パーセント点の定義より、
\begin{align}
P \left(-Z_\alpha \le Z_0\right)=1-\alpha
\end{align}
したがって、式 $(3)$ において、$b=-Z_\alpha$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-Z_\alpha \lt Z_0&\mathrm{0:Hold\ }H_0\\Z_0 \le -Z_\alpha&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
$\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.130-131
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.279-280
0 件のコメント:
コメントを投稿