本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題2.8」の自作解答例です。独立性の検定とコクラン検定の同等性に関する問題です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
- この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。
問題2.8.1:検定統計量の同等性① 独立性の検定とコクラン検定
(i)コクラン検定の検定統計量
検定統計量を計算すると、
\begin{align}
\chi_C^2&=\frac{ \left(an_2-bn_1\right)^2}{N^2} \cdot \frac{N^3}{n_1n_2m_1m_2}\\
&=\frac{N \left(an_2-bn_1\right)^2}{n_1n_2m_1m_2}
\end{align}
(ii)独立性の検定の検定統計量
検定統計量を計算すると、
\begin{align}
\chi_P^2=\frac{ \left[a-\hat{E} \left(a\right)\right]^2}{\hat{E} \left(a\right)}+\frac{ \left[b-\hat{E} \left(b\right)\right]^2}{\hat{E} \left(b\right)}+\frac{ \left[c-\hat{E} \left(c\right)\right]^2}{\hat{E} \left(c\right)}+\frac{ \left[d-\hat{E} \left(d\right)\right]^2}{\hat{E} \left(d\right)}
\end{align}
各セルの期待値 $\hat{E} \left(x_{ij}\right)=\frac{n_{i\bullet }n_{\bullet j}}{N}$ を代入すると、
\begin{align}
a-\hat{E} \left(a\right)&=a-\frac{ \left(a+c\right) \left(a+b\right)}{N}\\
&=\frac{a \left(a+b+c+d\right)- \left(a+c\right) \left(a+b\right)}{N}\\
&=\frac{ad-bc}{N}\tag{2}\\
b-\hat{E} \left(b\right)&=b-\frac{ \left(a+b\right) \left(b+d\right)}{N}\\
&=\frac{b \left(a+b+c+d\right)- \left(a+b\right) \left(b+d\right)}{N}\\
&=-\frac{ad-bc}{N}\tag{3}\\
c-\hat{E} \left(c\right)&=c-\frac{ \left(a+c\right) \left(c+d\right)}{N}\\
&=\frac{c \left(a+b+c+d\right)- \left(a+c\right) \left(c+d\right)}{N}\\
&=-\frac{ad-bc}{N}\tag{4}\\
d-\hat{E} \left(d\right)&=d-\frac{ \left(b+d\right) \left(c+d\right)}{N}\\
&=\frac{d \left(a+b+c+d\right)- \left(b+d\right) \left(c+d\right)}{N}\\
&=\frac{ad-bc}{N}\tag{5}
\end{align}
式 $(2)~(5)$ を式 $(1)$ に代入すると、
\begin{align}
\chi_0^2&= \left(\frac{ad-bc}{N}\right)^2 \left\{\frac{N}{ \left(a+c\right) \left(a+b\right)}+\frac{N}{ \left(a+b\right) \left(b+d\right)}+\frac{N}{ \left(a+c\right) \left(c+d\right)}+\frac{N}{ \left(b+d\right) \left(c+d\right)}\right\}\\
&=\frac{ \left(ad-bc\right)^2}{N} \left\{\frac{ \left(b+d\right) \left(c+d\right)+ \left(a+c\right) \left(c+d\right)+ \left(a+b\right) \left(b+d\right)+ \left(a+b\right) \left(a+c\right)}{ \left(a+b\right) \left(a+c\right) \left(b+d\right) \left(c+d\right)}\right\}\\
&=\frac{ \left(ad-bc\right)^2}{N} \left\{\frac{ \left(a+c\right) \left(a+b+c+d\right)+ \left(b+d\right) \left(a+b+c+d\right)}{ \left(a+b\right) \left(a+c\right) \left(b+d\right) \left(c+d\right)}\right\}\\
&=\frac{ \left(ad-bc\right)^2}{N} \left\{\frac{ \left(a+b+c+d\right) \left(a+b+c+d\right)}{ \left(a+b\right) \left(a+c\right) \left(b+d\right) \left(c+d\right)}\right\}\\
&=\frac{ \left(ad-bc\right)^2}{N} \cdot \frac{N^2}{ \left(a+b\right) \left(a+c\right) \left(b+d\right) \left(c+d\right)}\\
&=\frac{N \left(ad-bc\right)^2}{n_1n_2m_1m_2}
\end{align}
ここで、$c=n_1-a,d=n_2-b$ なので、
\begin{align}
\left[a \left(n_2-b\right)-b \left(n_1-a\right)\right]^2&= \left(an_2-ab-bn_1+ab\right)^2\\
&= \left(an_2-bn_1\right)^2
\end{align}
したがって、
\begin{align}
\chi_P^2=\frac{N \left(an_2-bn_1\right)^2}{n_1n_2m_1m_2}
\end{align}
ゆえに、
\begin{align}
\chi_C^2=\chi_P^2
\end{align}
$\blacksquare$
問題2.8.2:検定統計量の同等性② コクラン検定と母比率の差の検定
帰無仮説における共通の母比率 $\pi$ の一致推定量は、 \begin{align} \hat{\pi}=\frac{a+b}{n_1+n_2}=\frac{m_1}{N} \end{align} このとき、母比率の差に関する検定の検定統計量は、 \begin{align} Z&=\frac{\sqrt{n_1n_2} \left(p_1-p_2\right)}{\sqrt{N\hat{\pi} \left(1-\hat{\pi}\right)}}\\ \Leftrightarrow Z^2&=\frac{n_1n_2 \left(p_1-p_2\right)^2}{Np \left(1-p\right)} \end{align} ここで、$p_1=\frac{a}{n_1},p_2=\frac{b}{n_2},p=\frac{m_1}{N}$ より、 \begin{align} n_1n_2 \left(p_1-p_2\right)^2&=n_1n_2 \left(\frac{a}{n_1}-\frac{b}{n_2}\right)^2\\ &=n_1n_2 \left(\frac{an_2-bn_1}{n_1n_2}\right)^2\\ &=\frac{ \left(an_2-bn_1\right)^2}{n_1n_2}\\ Np \left(1-p\right)&=N \cdot \frac{m_1}{N} \cdot \frac{m_2}{N}\\ &=\frac{m_1m_2}{N} \end{align} したがって、 \begin{align} Z^2=\frac{ \left(an_2-bn_1\right)^2}{n_1n_2} \cdot \frac{N}{m_1m_2}=\chi_P^2 \end{align} $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.84
0 件のコメント:
コメントを投稿