曝露と発症の関連を調べるための検定方法には、①発症リスク差に関する検定、②ピアソンの $\chi^2$検定(独立性の検定)、③コクラン検定、④マンテル・ヘンツェル検定などの方法がありますが、本稿では、これらの方法は漸近的に、数学的に同値であることを証明しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
【命題】分割表の諸検定の同等性
【命題】
分割表の諸検定の同等性
Statistical Tests for Contingency Table are Equal to Each Other
曝露と発症の関連を調べるための分割表に関する検定方法にはいくつかの方法があるが、次の4つの方法は数学的に同値である。
発症リスク差に関する検定 \begin{align} Z_0=\frac{\sqrt{n_1n_0} \left({\hat{\pi}}_1-{\hat{\pi}}_0\right)}{\sqrt{N\hat{\pi} \left(1-\hat{\pi}\right)}}\Leftrightarrow\chi_0^2=\frac{n_1n_0 \left({\hat{\pi}}_1-{\hat{\pi}}_0\right)^2}{N\hat{\pi} \left(1-\hat{\pi}\right)} \end{align} ピアソンの $\chi^2$検定(独立性の検定) \begin{align} \chi_{\mathrm{P}}^2=\frac{N \left(ad-bc\right)^2}{n_1n_0m_1m_0} \end{align} コクラン検定 \begin{gather} \chi_{\mathrm{C}}^2=\frac{ \left(\frac{n_0a-n_1b}{N}\right)^2}{\frac{n_1n_0m_1m_0}{N^3}} \end{gather} マンテル・ヘンツェル検定 \begin{align} \chi_{\mathrm{MH}}^2=\frac{ \left(a-\frac{n_1m_1}{N}\right)^2}{\frac{m_1m_0n_1n_0}{N^2 \left(N-1\right)}} \end{align} これらの検定統計量に対し、漸近的に \begin{gather} \chi_0^2=\chi_{\mathrm{P}}^2=\chi_{\mathrm{C}}^2=\chi_{\mathrm{MH}}^2 \end{gather}
証明
(i)コクラン検定の検定統計量
検定統計量の形式を整理すると、
\begin{align}
\chi_{\mathrm{C}}^2&=\frac{ \left(an_0-bn_1\right)^2}{N^2} \cdot \frac{N^3}{n_1n_0m_1m_0}\\
&=\frac{N \left(an_0-bn_1\right)^2}{n_1n_0m_1m_0}\tag{1}
\end{align}
(ii)ピアソンの $\chi^2$検定の検定統計量
検定統計量は、
\begin{align}
\chi_{\mathrm{P}}^2=\frac{N \left(ad-bc\right)^2}{n_1n_0m_1m_0}
\end{align}
ここで、$c=n_1-a,d=n_0-b$ なので、
\begin{align}
\left[a \left(n_0-b\right)-b \left(n_1-a\right)\right]^2&= \left(an_0-ab-bn_1+ab\right)^2\\
&= \left(an_0-bn_1\right)^2
\end{align}
したがって、
\begin{align}
\chi_{\mathrm{P}}^2=\frac{N \left(an_0-bn_1\right)^2}{n_1n_0m_1m_0}\tag{2}
\end{align}
(iii)発症リスク差に関する検定の検定統計量
検定統計量を2乗すると、
\begin{align}
\chi_0^2=\frac{n_1n_0 \left({\hat{\pi}}_1-{\hat{\pi}}_0\right)^2}{N\hat{\pi} \left(1-\hat{\pi}\right)}
\end{align}
ここで、各値の推定量
\begin{gather}
{\hat{\pi}}_1=\frac{a}{n_1} \quad {\hat{\pi}}_0=\frac{b}{n_0} \quad \hat{\pi}=\frac{m_1}{N}
\end{gather}
を代入すると、
分子は、
\begin{align}
n_1n_0 \left({\hat{\pi}}_1-{\hat{\pi}}_0\right)^2&=n_1n_0 \left(\frac{a}{n_1}-\frac{b}{n_0}\right)^2\\
&=n_1n_0 \left(\frac{an_0-bn_1}{n_1n_0}\right)^2\\
&=\frac{ \left(an_0-bn_1\right)^2}{n_1n_0}
\end{align}
分母は、
\begin{align}
N\hat{\pi} \left(1-\hat{\pi}\right)&=N \cdot \frac{m_1}{N} \cdot \frac{m_0}{N}\\
&=\frac{m_1m_0}{N}
\end{align}
したがって、
\begin{align}
\chi_0^2&=\frac{ \left(an_0-bn_1\right)^2}{n_1n_0} \cdot \frac{N}{m_1m_0}\\
&=\frac{N \left(an_0-bn_1\right)^2}{n_1n_0m_1m_0}\tag{3}
\end{align}
(iv)マンテル・ヘンツェル検定の検定統計量
検定統計量の形式を整理すると、
\begin{align}
\chi_{\mathrm{MH}}^2&= \left(a-\frac{n_1m_1}{N}\right)^2 \cdot \frac{N^2 \left(N-1\right)}{m_1m_0n_1n_0}\\
&=\frac{ \left\{a \left(n_0+n_1\right)-n_1 \left(a+b\right)\right\}^2}{N^2} \cdot \frac{N^2 \left(N-1\right)}{m_1m_0n_1n_0}\\
&=\frac{ \left(an_0-bn_1\right)^2}{N^2} \cdot \frac{N^2 \left(N-1\right)}{m_1m_0n_1n_0}\\
&=\frac{ \left(N-1\right) \left(an_0-bn_1\right)^2}{m_1m_0n_1n_0}\tag{4}
\end{align}
サンプルサイズが十分に大きく、1の差が無視できるとき、
\begin{gather}
\lim_{N\rightarrow\infty}{N-1}=N
\end{gather}
したがって、式 $(1),(2),(3),(4)$ より、漸近的に \begin{gather} \chi_0^2=\chi_{\mathrm{P}}^2=\chi_{\mathrm{C}}^2=\chi_{\mathrm{MH}}^2 \end{gather} $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.38-43
0 件のコメント:
コメントを投稿