本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングあり、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
分割表の形式
指示変数 $j$ を任意の被験者の発症状況を表す変数
\begin{align}
j= \left\{\begin{matrix}1&\mathrm{Disease} \left(D\right)\\0&\mathrm{Not\ disease}(\bar{D})\\\end{matrix}\right.
\end{align}
とし、
発症者1人に対し、背景因子の水準が同程度の非発症者を1人マッチングし、計2人のペアを作る。そして、調整したい交絡因子の水準にもとづいて、互いに独立な $K$ 個の層に層化する。
このペアの総数(サンプルサイズ)を
\begin{align}
N_k
\end{align}
とし、曝露状況について調べる。
指示変数 $Y$ を $i$ 番目のペアの $j$ 番目のメンバーの曝露状況を表す変数
\begin{align}
y_{ijk}= \left\{\begin{matrix}1&\mathrm{Exposed} \left(E\right)\\0&\mathrm{Unexposed}(\bar{E})\\\end{matrix}\right.
\end{align}
とする。
このとき、各ペアの発症・曝露状況は、
発症者・非発症者=①曝露あり・曝露あり、②曝露あり・曝露なし、
③曝露なし・曝露あり、④曝露なし・曝露なし
\begin{gather}
\left(y_{i1k},y_{i0k}\right)= \left(1,1\right), \left(1,0\right), \left(0,1\right), \left(0,0\right)
\end{gather}
のいずれかに分類される。
それぞれの発症・曝露状況に該当するペアの数を
\begin{gather}
e_k \left(=n_{11k}\right) \quad f_k \left(=n_{12k}\right) \quad g_k \left(=n_{21k}\right) \quad h_k \left(=n_{22k}\right)
\end{gather}
とする。
また、周辺度数として、
①発症者が曝露したペア、②発症者が曝露しなかったペア、
③非発症者が曝露したペア、④非発症者が曝露しなかったペア
が得られる。
それぞれの合計ペア数を
\begin{gather}
n_{DEk} \left(=n_{1\bullet k}\right) \quad n_{D\bar{E}k} \left(=n_{0\bullet k}\right) \quad n_{\bar{D}Ek} \left(=n_{\bullet 1k}\right) \quad n_{\bar{D}\bar{E}k} \left(=n_{\bullet 0k}\right)
\end{gather}
とする。
非発症者 $(\bar{D})$ | 合計 | |||
---|---|---|---|---|
曝露あり $(E)$ | 曝露なし $(\bar{E})$ | |||
発症者 $(D)$ | 曝露あり $(E)$ | $e_k$ $ \left(=n_{11k}\right)$ | $f_k$ $ \left(=n_{12k}\right)$ | $n_{DEk}$ $ \left(=n_{1\bullet k}\right)$ |
曝露なし $(\bar{E})$ | $g_k$ $ \left(=n_{21k}\right)$ | $h_k$ $ \left(=n_{22k}\right)$ | $n_{D\bar{E}k}$ $ \left(=n_{0\bullet k}\right)$ | |
合計 | $n_{\bar{D}Ek}$ $ \left(=n_{\bullet 1k}\right)$ | $n_{\bar{D}\bar{E}k}$ $ \left(=n_{\bullet 0k}\right)$ | $N_k$ |
統計モデル
各セルの観測値 \begin{align} \boldsymbol{n}_\boldsymbol{k}= \left(\begin{matrix}e_k\\f_k\\g_k\\h_k\\\end{matrix}\right) \end{align} が四項分布
\begin{gather} \boldsymbol{n}_\boldsymbol{k} \sim \mathrm{MN} \left(N_k,\boldsymbol{\phi}_\boldsymbol{k}\right)\\ \boldsymbol{\phi}_\boldsymbol{k}= \left(\begin{matrix}\phi_{11k}\\\phi_{12k}\\\phi_{21k}\\\phi_{22k}\\\end{matrix}\right) \end{gather} に従うとする。
非発症者 $(\bar{D})$ | 合計 | |||
---|---|---|---|---|
曝露あり $(E)$ | 曝露なし $(\bar{E})$ | |||
発症者 $(D)$ | 曝露あり $(E)$ | $\phi_{11k}$ | $\phi_{12k}$ | $\phi_{DEk}$ $ \left(=\pi_{1\bullet k}\right)$ |
曝露なし $(\bar{E})$ | $\phi_{21k}$ | $\phi_{22k}$ | $\phi_{D\bar{E}k}$ $ \left(=\pi_{0\bullet k}\right)$ | |
合計 | $\phi_{\bar{D}Ek}$ $ \left(=\phi_{\bullet 1k}\right)$ | $\phi_{\bar{D}\bar{E}k}$ $ \left(=\phi_{\bullet 0k}\right)$ | $1$ |
四項尤度
\begin{align} L \left(\boldsymbol{\phi}_\boldsymbol{k}\right)=\frac{N_k!}{e_k!f_k!g_k!h_k!}\phi_{11}^{e_k}\phi_{12}^{f_k}\phi_{21}^{g_k}\phi_{22}^{h_k} \end{align}
曝露効果の指標
標本比率
\begin{gather} {\hat{\phi}}_{11k}=\frac{e_k}{N_k} \quad {\hat{\phi}}_{12k}=\frac{f_k}{N_k}\\ {\hat{\phi}}_{21k}=\frac{g_k}{N_k} \quad {\hat{\phi}}_{22k}=\frac{h_k}{N_k} \end{gather}
条件付き周辺曝露オッズ比
\begin{gather} {\mathrm{OR}}_{zk}=\frac{\phi_{ \left.12k\right|z}}{\phi_{ \left.21k\right|z}}\\ \end{gather}
条件付き曝露オッズ比
\begin{gather} {\mathrm{OR}}_{Ck}=\frac{\phi_{12k}}{\phi_{21k}}\\ {\mathrm{\widehat{OR}}}_{Ck}=\frac{{\hat{\phi}}_{12k}}{{\hat{\phi}}_{21k}}=\frac{f_k}{g_k} \end{gather}
母集団平均発症リスク比
\begin{gather} {\mathrm{RR}}_{Ak}=\frac{\phi_{1\bullet k}}{\phi_{\bullet 1k}}=\frac{\phi_{11k}+\phi_{12k}}{\phi_{11k}+\phi_{21k}}\\ {\mathrm{\widehat{RR}}}_{Ak}=\frac{{\hat{\phi}}_{1\bullet k}}{{\hat{\phi}}_{\bullet 1k}}=\frac{{\hat{\phi}}_{11k}+{\hat{\phi}}_{12k}}{{\hat{\phi}}_{11k}+{\hat{\phi}}_{21k}}=\frac{e_k+f_k}{e_k+g_k}=\frac{n_{1\bullet k}}{n_{\bullet 1k}} \end{gather}
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.242-245
0 件のコメント:
コメントを投稿