本稿では、層別解析に対するコクラン検定の検定統計量の導出を行っています。この方法は、層別解析に対するマンテル・ヘンツェル検定と漸近的に等しくなるため、しばしば、まとめてコクラン・マンテル・ヘンツェル検定と呼ばれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
【定理】層別解析に対するコクラン検定
【定理】
層別解析に対するコクラン検定
Cochran Test for Stratified Analysis
マッチングなし・層化ありのコホート研究(積二項モデル)において、すべての層に共通オッズ比が存在すると仮定し、
帰無仮説を
全層共通のオッズ比が1である
\begin{align}
H_0:\varphi_k=1\Leftrightarrow\pi_{1k}=\pi_{0k}
\end{align}
対立仮説を
1ではない全層共通のオッズ比が存在する
\begin{align}
H_1:\varphi_k=\varphi \left( \neq 1\right)\Leftrightarrow\pi_{1k} \neq \pi_{0k}
\end{align}
として、
コクラン検定統計量は、漸近的に
\begin{align}
\chi_{\mathrm{C}}^2=\frac{ \left[\sum_{k=1}^{K} \left\{a_k-\frac{n_{1k}m_{1k}}{N_k}\right\}\right]^2}{\sum_{k=1}^{K} \left[\frac{n_{1k}n_{0k}m_{1k}m_{0k}}{N_k^3}\right]}
\end{align}
で与えられる。
導出
単一の層のときと同様の過程により、帰無仮説 $\pi_{1k}=\pi_{2k}=\pi_k$ のもとで、
曝露群の発症人数 $a_k$ の期待値とその一致推定量は、
\begin{gather}
E \left(a_k\right)=n_{1k}\pi_k\\
\hat{E} \left(a_k\right)=\frac{m_{1k}n_{1k}}{N_k}
\end{gather}
曝露群の発症人数 $a_k$ の分散とその一致推定量は、
\begin{gather}
V \left(a_k\right)=n_{1k}\pi_k \left(1-\pi_k\right)\\
\hat{V} \left(a_k\right)=\frac{m_{1k}m_{0k}n_{1k}}{N_k^2}
\end{gather}
実測値と期待値の一致推定量の差の分散は、
\begin{gather}
V \left[a_k-\hat{E} \left(a_k\right)\right]=\frac{n_{1k}n_{0k}\pi_k \left(1-\pi_k\right)}{N}\\
\hat{V} \left[a_k-\hat{E} \left(a_k\right)\right]=\frac{n_{1k}n_{0k}m_{1k}m_{0k}}{N_k^3}
\end{gather}
二項分布の正規近似より、漸近的に
\begin{gather}
a_k-\hat{E} \left(a_k\right) \sim \mathrm{N} \left(0,V_{ck}\right)\\
V_{\mathrm{C}k}^2=\frac{n_{1k}n_{0k}m_{1k}m_{0k}}{N_k^3}
\end{gather}
正規分布の再生性より、
\begin{gather}
\sum_{k=1}^{K} \left\{a_k-\hat{E} \left(a_k\right)\right\} \sim \mathrm{N} \left(0,V_{\mathrm{C}+}^2\right)\\
V_{\mathrm{C}+}^2=\sum_{k=1}^{K}\frac{n_{1k}n_{0k}m_{1k}m_{0k}}{N_k^3}
\end{gather}
これを標準化した値は、
\begin{align}
\frac{\sum_{k=1}^{K} \left\{a_k-\hat{E} \left(a_k\right)\right\}}{V_{\mathrm{C}+}}=Z_{\mathrm{C}} \sim \mathrm{N} \left(0,1\right)
\end{align}
したがって、$\chi^2$分布の定義より、
\begin{align}
\chi_{\mathrm{C}}^2&=\frac{ \left[\sum_{k=1}^{K} \left\{a_k-\hat{E} \left(a_k\right)\right\}\right]^2}{V_{\mathrm{C}+}^2}\\
&=\frac{ \left[\sum_{k=1}^{K} \left\{a_k-\frac{n_{1k}m_{1k}}{N_k}\right\}\right]^2}{\sum_{k=1}^{K} \left[\frac{n_{1k}n_{0k}m_{1k}m_{0k}}{N_k^3}\right]}
\end{align}
これは、
\begin{align}
\chi_{\mathrm{C}}^2 \sim \chi^2 \left(1\right)
\end{align}
$\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.133-134
- Cochran, W.G.. Some Methods for Strengthening the Common $\chi^2$ Tests. Biometrics. 1954;10(4):417-451, doi: https://doi.org/10.2307/3001616
0 件のコメント:
コメントを投稿