本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングなし、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
周辺解析
分割表の形式
発症群と非発症群の観察対象人数をそれぞれ、 \begin{gather} n_{1\bullet } \quad n_{0\bullet }\\ N_{\bullet }=n_{1\bullet }+n_{0\bullet } \end{gather} 曝露者と非曝露者の人数をそれぞれ、 \begin{gather} m_{1\bullet } \quad m_{0\bullet }\\ N_{\bullet }=m_{1\bullet }+m_{0\bullet } \end{gather} 発症群と非発症群の曝露人数をそれぞれ、 \begin{gather} a_{\bullet } \quad b_{\bullet } \end{gather} 発症群と非発症群の非曝露人数をそれぞれ、 \begin{gather} c_{\bullet } \quad d_{\bullet } \end{gather} とする。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $a_{\bullet }$ | $c_{\bullet }$ | $n_{1\bullet }$ |
コントロール群 $(\bar{E})$ | $b_{\bullet }$ | $d_{\bullet }$ | $n_{0\bullet }$ |
合計 | $m_{1\bullet }$ | $m_{0\bullet }$ | $N_{\bullet }$ |
統計モデル①:積二項モデル
発症群と非発症群の曝露人数 $a_{\bullet },b_{\bullet }$ が互いに独立に、
試行回数がそれぞれ
\begin{align}
n_{1\bullet } \quad n_{0\bullet }
\end{align}
母比率(曝露確率)がそれぞれ
\begin{align}
\phi_{1\bullet }=P \left(E\middle| D\right) \quad \phi_{0\bullet }=P \left(\bar{E}\middle| D\right)
\end{align}
である
二項分布
\begin{align}
a_{\bullet } \sim \mathrm{B} \left(n_{1\bullet },\phi_{1\bullet }\right) \quad b_{\bullet } \sim \mathrm{B} \left(n_{0\bullet },\phi_{0\bullet }\right)
\end{align}
に従うとする。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $\phi_{1\bullet }$ | $1-\phi_{1\bullet }$ | $1$ |
コントロール群 $(\bar{E})$ | $\phi_{0\bullet }$ | $1-\phi_{0\bullet }$ | $1$ |
統計モデル②:超幾何分布モデル
周辺度数 \begin{gather} n_{1\bullet } \quad n_{0\bullet } \quad m_{1\bullet } \quad m_{0\bullet } \end{gather} が固定されているという条件の下で、 発症群の曝露人数 $a_{\bullet }$ が超幾何分布 \begin{align} a_{\bullet } \sim \mathrm{HG} \left(N_{\bullet },n_{1\bullet },m_{1\bullet }\right) \end{align} に従うとする。
曝露効果の指標
曝露オッズ
\begin{gather} {\mathrm{OD}}_{1\bullet }=\frac{\phi_{1\bullet }}{1-\phi_{1\bullet }} \quad {\mathrm{OD}}_{0\bullet }=\frac{\phi_{0\bullet }}{1-\phi_{0\bullet }}\\ {\mathrm{\widehat{OD}}}_{1\bullet }=\frac{{\hat{\phi}}_{1\bullet }}{1-{\hat{\phi}}_{1\bullet }}=\frac{a_{\bullet }}{c_{\bullet }} \quad {\mathrm{\widehat{OD}}}_{0\bullet }=\frac{{\hat{\phi}}_{0\bullet }}{1-{\hat{\phi}}_{0\bullet }}=\frac{b_{\bullet }}{d_{\bullet }} \end{gather}
曝露オッズ比
\begin{gather} \delta={\mathrm{OR}}_{\bullet }=\frac{{\mathrm{OD}}_{1\bullet }}{{\mathrm{OD}}_{0\bullet }}=\frac{\phi_{1\bullet }}{1-\phi_{1\bullet }} \cdot \frac{1-\phi_{0\bullet }}{\phi_{0\bullet }}\\ \hat{\delta}={\mathrm{\widehat{OR}}}_{\bullet }=\frac{{\mathrm{\widehat{OD}}}_{1\bullet }}{{\mathrm{\widehat{OD}}}_{0\bullet }}=\frac{{\hat{\phi}}_{1\bullet }}{1-{\hat{\phi}}_{1\bullet }} \cdot \frac{1-{\hat{\phi}}_{0\bullet }}{{\hat{\phi}}_{0\bullet }}=\frac{a_{\bullet }d_{\bullet }}{b_{\bullet }c_{\bullet }} \end{gather}
交絡の調整
しかし、このような単純な周辺解析を行うと、交絡の影響により、誤った結論に陥る可能性がある。そのため、「対象者の限定」の原理にもとづいて交絡因子の影響を取り除くために、得られたデータを交絡因子の水準にもとづいて、互いに独立な $K$ 個の層に層化する。
層別解析
分割表の形式
第 $k$ 層における発症群と非発症群の観察対象人数をそれぞれ、 \begin{gather} n_{1k} \quad n_{0k}\\ N_k=n_{1k}+n_{0k} \end{gather} 曝露者と非曝露者の人数をそれぞれ、 \begin{gather} m_{1k} \quad m_{0k}\\ N_k=m_{1k}+m_{0k} \end{gather} 発症群と非発症群の曝露人数をそれぞれ、 \begin{gather} a_k \quad b_k \end{gather} 発症群と非発症群の非曝露人数をそれぞれ、 \begin{gather} c_k \quad d_k \end{gather} とする。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $a_k$ | $c_k$ | $n_{1k}$ |
コントロール群 $(\bar{E})$ | $b_k$ | $d_k$ | $n_{0k}$ |
合計 | $m_{1k}$ | $m_{0k}$ | $N_k$ |
ただし、 \begin{gather} a_{\bullet }=\sum_{k=1}^{K}a_k \quad b_{\bullet }=\sum_{k=1}^{K}b_k\\ c_{\bullet }=\sum_{k=1}^{K}c_k \quad d_{\bullet }=\sum_{k=1}^{K}d_k\\ m_{1\bullet }=\sum_{k=1}^{K}m_{1k} \quad m_{0\bullet }=\sum_{k=1}^{K}m_{0k}\\ n_{1\bullet }=\sum_{k=1}^{K}n_{1k} \quad n_{0\bullet }=\sum_{k=1}^{K}n_{0k}\\ N_{\bullet }=\sum_{k=1}^{K}N_k \end{gather}
統計モデル①:積二項モデル
第 $k$ 層の発症群と非発症群の曝露人数 $a_k,b_k$ が互いに独立に、 試行回数がそれぞれ \begin{align} n_{1k} \quad n_{0k} \end{align} 母比率(曝露確率)がそれぞれ \begin{align} \phi_{1k}=P \left(E\middle| D\right) \quad \phi_{0k}=P \left(\bar{E}\middle| D\right) \end{align} である 二項分布 \begin{align} a_k \sim \mathrm{B} \left(n_{1k},\phi_{1k}\right) \quad b_k \sim \mathrm{B} \left(n_{0k},\phi_{0k}\right) \end{align} に従うとする。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $\phi_{1k}$ | $1-\phi_{1k}$ | $1$ |
コントロール群 $(\bar{E})$ | $\phi_{0k}$ | $1-\phi_{0k}$ | $1$ |
積二項尤度
\begin{align} H_0:\phi_{1k}=\phi_{0k} \left(=\phi_k\right) \quad \mathrm{vs.} \quad H_1:\phi_{1k} \neq \phi_{0k} \end{align} として、 第 $k$ 層の尤度関数 \begin{gather} L_{1k} \left(\phi_{1k},\phi_{0k}\right)={}_{n_{1k}}C_{a_k} \cdot \phi_{1k}^{a_k} \left(1-\phi_{1k}\right)^{n_{1k}-a_k} \cdot {}_{n_{0k}}C_{b_k} \cdot \phi_{0k}^{b_k} \left(1-\phi_{0k}\right)^{n_{0k}-b_k}\\ L_{0k} \left(\phi_k\right)={}_{n_1}C_{a_k} \cdot {}_{n_0}C_{b_k} \cdot \phi_k^{a_k+b_k} \left(1-\phi_k\right)^{n_{1k}+n_{0k}-a_k-b_k} \end{gather} 各層の発症人数が互いに独立なとき、全体の尤度関数 \begin{gather} L_1 \left(\boldsymbol{\phi}_\boldsymbol{1},\boldsymbol{\phi}_\boldsymbol{0}\right)=\prod_{k=1}^{K}{{}_{n_{1k}}C_{a_k} \cdot \phi_{1k}^{a_k} \left(1-\phi_{1k}\right)^{n_{1k}-a_k} \cdot {}_{n_{0k}}C_{b_k} \cdot \phi_{0k}^{b_k} \left(1-\phi_{0k}\right)^{n_{0k}-b_k}}\\ L_0 \left(\boldsymbol{\phi}\right)=\prod_{k=1}^{K}{{}_{n_1}C_{a_k} \cdot {}_{n_0}C_{b_k} \cdot \phi_k^{a_k+b_k} \left(1-\phi_k\right)^{n_{1k}+n_{0k}-a_k-b_k}} \end{gather}
統計モデル②:超幾何分布モデル
各層の周辺度数 \begin{gather} n_{1k} \quad n_{0k} \quad m_{1k} \quad m_{0k} \end{gather} が固定されているという条件の下で、 各層の曝露群の発症人数 $a_k$ が超幾何分布 \begin{align} a_k \sim \mathrm{HG} \left(N_k,n_{1k},m_{1k}\right) \end{align} に従うとする。
超幾何尤度
\begin{gather} H_0:\varphi_k=1 \quad \mathrm{vs.} \quad H_1:\varphi_k \neq 1\\ \varphi_k={\mathrm{OR}}_k \end{gather} として、 \begin{align} L_{1k} \left(\varphi_k\right)&=\frac{{}_{n_1}C_{a_k} \cdot {}_{n_0}C_{m_1-a_k} \cdot \varphi_k^{a_k}}{\sum_{i=a_{kl}}^{a_{ku}}{{}_{n_1}C_i \cdot {}_{n_0}C_{m_1-i} \cdot \varphi_k^i}}\\ L_{0k} \left(\varphi_k\right)&=\frac{{}_{n_{1k}}C_{a_k} \cdot {}_{N_k-n_{1k}}C_{m_{1k}-a_k}}{{}_{N_k}C_{m_{1k}}}\\ &=\frac{n_{1k}!n_{0k}!m_{1k}!m_{0k}!}{N_k!a_k!b_k!c_k!d_k!} \end{align} 各層の発症人数が互いに独立なとき、全体の尤度関数 \begin{gather} L_1 \left(\boldsymbol{\varphi}\right)=\prod_{k=1}^{K}\frac{{}_{n_1}C_{a_k} \cdot {}_{n_0}C_{m_1-a_k} \cdot \varphi_k^{a_k}}{\sum_{i=a_{kl}}^{a_{ku}}{{}_{n_1}C_i \cdot {}_{n_0}C_{m_1-i} \cdot \varphi_k^i}}\\ L_0 \left(\boldsymbol{\varphi}\right)=\prod_{k=1}^{K}\frac{n_{1k}!n_{0k}!m_{1k}!m_{0k}!}{N_k!a_k!b_k!c_k!d_k!} \end{gather}
曝露効果の指標
発生割合
\begin{gather} \phi_{1k} \quad \phi_{0k}\\ {\hat{\phi}}_{1k}=\frac{a_k}{n_{1k}} \quad {\hat{\phi}}_0=\frac{b_k}{n_{0k}} \end{gather}
曝露オッズ
\begin{gather} {\mathrm{OD}}_{1k}=\frac{\phi_{1k}}{1-\phi_{1k}} \quad {\mathrm{OD}}_{0k}=\frac{\phi_{0k}}{1-\phi_{0k}}\\ {\mathrm{\widehat{OD}}}_{1k}=\frac{{\hat{\phi}}_{1k}}{1-{\hat{\phi}}_{1k}}=\frac{a_k}{c_k} \quad {\mathrm{\widehat{OD}}}_{0k}=\frac{{\hat{\phi}}_{0k}}{1-{\hat{\phi}}_{0k}}=\frac{b_k}{d_k} \end{gather}
曝露オッズ比
\begin{gather} \delta={\mathrm{OR}}_k=\frac{{\mathrm{OD}}_{1k}}{{\mathrm{OD}}_{0k}}=\frac{\phi_{1k}}{1-\phi_{1k}} \cdot \frac{1-\phi_{0k}}{\phi_{0k}}\\ \hat{\delta}={\mathrm{\widehat{OR}}}_k=\frac{{\mathrm{\widehat{OD}}}_{1k}}{{\mathrm{\widehat{OD}}}_{0k}}=\frac{{\hat{\phi}}_{1k}}{1-{\hat{\phi}}_{1k}} \cdot \frac{1-{\hat{\phi}}_{0k}}{{\hat{\phi}}_{0k}}=\frac{a_kd_k}{b_kc_k} \end{gather}
検定仮説
特に、層別解析に対するコクラン検定やマンテル・ヘンツェル検定を想定する場合、 各層に共通した曝露効果がある との前提から始める。
帰無仮説
帰無仮説は、 全層共通のオッズ比が1である すなわち、すべての $k=1,2, \cdots ,K$ に対し、 \begin{align} H_0:\varphi_k=1 \end{align} これは、 すべての層で発症群と非発症群の曝露確率が等しい \begin{align} H_0:\phi_{1k}=\phi_{0k} \end{align} という仮説と同値である。
対立仮説
対立仮説は、 1ではない全層共通のオッズ比が存在する すなわち、すべての $k=1,2, \cdots ,K$ に対し、 \begin{align} H_1:\varphi_k=\varphi \left( \neq 1\right) \end{align} これは、 各層の発症群と非発症群の曝露確率は等しくない \begin{align} H_0:\phi_{1k} \neq \phi_{0k} \end{align} という仮説と同値である。
参考文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.260
0 件のコメント:
コメントを投稿