ケース・コントロール研究(マッチングあり・層化なし)

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A052】ケース・コントロール研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングあり、②層化なしのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

分割表の形式

指示変数 $j$ を任意の被験者の発症状況を表す変数 \begin{align} j= \left\{\begin{matrix}1&\mathrm{Disease} \left(D\right)\\0&\mathrm{Not\ disease}(\bar{D})\\\end{matrix}\right. \end{align} とし、 発症者1人に対し、背景因子の水準が同程度の非発症者を1人マッチングし、計2人のペアを作る。
このペアの総数(サンプルサイズ)を \begin{align} N \end{align} とし、曝露状況について調べる。 指示変数 $Y$ を $i$ 番目のペアの $j$ 番目のメンバーの曝露状況を表す変数 \begin{align} y_{ij}= \left\{\begin{matrix}1&\mathrm{Exposed} \left(E\right)\\0&\mathrm{Unexposed}(\bar{E})\\\end{matrix}\right. \end{align} とする。

このとき、各ペアの発症・曝露状況は、 発症者・非発症者=①曝露あり・曝露あり、②曝露あり・曝露なし、
③曝露なし・曝露あり、④曝露なし・曝露なし
\begin{gather} \left(y_{i1},y_{i0}\right)= \left(1,1\right), \left(1,0\right), \left(0,1\right), \left(0,0\right) \end{gather} のいずれかに分類される。 それぞれの発症・曝露状況に該当するペアの数を \begin{gather} e \left(=n_{11}\right) \quad f \left(=n_{12}\right) \quad g \left(=n_{21}\right) \quad h \left(=n_{22}\right) \end{gather} とする。

また、周辺度数として、 ①発症者が曝露したペア、②発症者が曝露しなかったペア、
③非発症者が曝露したペア、④非発症者が曝露しなかったペア
が得られる。 それぞれの合計ペア数を \begin{gather} n_{DE} \left(=n_{1\bullet }\right) \quad n_{D\bar{E}} \left(=n_{0\bullet }\right) \quad n_{\bar{D}E} \left(=n_{\bullet 1}\right) \quad n_{\bar{D}\bar{E}} \left(=n_{\bullet 0}\right) \end{gather} とする。

表1 ペア・マッチングを行ったケース・コントロール研究に関する
$2\times2$ 分割表(観測値)
非発症者
$(\bar{D})$
合計
曝露あり
$(E)$
曝露なし
$(\bar{E})$
発症者
$(D)$
曝露あり
$(E)$
$e$
$ \left(=n_{11}\right)$
$f$
$ \left(=n_{12}\right)$
$n_{DE}$
$ \left(=n_{1\bullet }\right)$
曝露なし
$(\bar{E})$
$g$
$ \left(=n_{21}\right)$
$h$
$ \left(=n_{22}\right)$
$n_{D\bar{E}}$
$ \left(=n_{0\bullet }\right)$
合計 $n_{\bar{D}E}$
$ \left(=n_{\bullet 1}\right)$
$n_{\bar{D}\bar{E}}$
$ \left(=n_{\bullet 0}\right)$
$N$

統計モデル①:四項分布モデル

各セルの観測値 \begin{align} \boldsymbol{n}= \left(\begin{matrix}e\\f\\g\\h\\\end{matrix}\right) \end{align} が四項分布

\begin{gather} \boldsymbol{n} \sim \mathrm{MN} \left(N,\boldsymbol{\pi}\right)\\ \boldsymbol{\pi}= \left(\begin{matrix}\pi_{11}\\\pi_{12}\\\pi_{21}\\\pi_{22}\\\end{matrix}\right) \end{gather} に従うとする。

表2 マッチングを行った横断研究・コホート研究に関する
$2\times2$ 分割表(四項分布モデル)
非発症者
$(\bar{D})$
合計
曝露あり
$(E)$
曝露なし
$(\bar{E})$
発症者
$(D)$
曝露あり
$(E)$
$\phi_{11}$ $\phi_{12}$ $\phi_{DE}$
$ \left(=\pi_{1\bullet }\right)$
曝露なし
$(\bar{E})$
$\phi_{21}$ $\phi_{22}$ $\phi_{D\bar{E}}$
$ \left(=\pi_{0\bullet }\right)$
合計 $\phi_{\bar{D}E}$
$ \left(=\phi_{\bullet 1}\right)$
$\phi_{\bar{D}\bar{E}}$
$ \left(=\phi_{\bullet 0}\right)$
$1$

四項尤度

\begin{align} L \left(\boldsymbol{\phi}\right)=\frac{N!}{e!f!g!h!}\phi_{11}^e\phi_{12}^f\phi_{21}^g\phi_{22}^h \end{align}

統計モデル②:条件付き二項分布モデル

この考え方では、①抽出したものが不一致な応答であり、②応答の総数 \begin{gather} M=f+g \end{gather} が固定されていると仮定する。 この条件の下で、「曝露あり・曝露なし」のペア数 $f$ が \begin{align} f \sim \mathrm{B} \left(M,\frac{\phi_{12}}{\phi_{12}+\phi_{21}}\right) \end{align} に従うとする。

条件付き二項尤度

\begin{align} L \left(\boldsymbol{\pi}\right)=\frac{M!}{f!g!} \left(\frac{\phi_{12}}{\phi_{12}+\phi_{21}}\right)^f \left(\frac{\phi_{21}}{\phi_{12}+\phi_{21}}\right)^g \end{align}

曝露効果の指標

標本比率

\begin{gather} {\hat{\phi}}_{11}=\frac{e}{N} \quad {\hat{\phi}}_{12}=\frac{f}{N}\\ {\hat{\phi}}_{21}=\frac{g}{N} \quad {\hat{\phi}}_{22}=\frac{h}{N} \end{gather}

条件付き周辺曝露オッズ比

\begin{gather} {\mathrm{OR}}_z=\frac{\phi_{ \left.12\right|z}}{\phi_{ \left.21\right|z}}\\ \end{gather}

条件付き曝露オッズ比

\begin{gather} {\mathrm{OR}}_C=\frac{\phi_{12}}{\phi_{21}}\\ {\mathrm{\widehat{OR}}}_C=\frac{{\hat{\phi}}_{12}}{{\hat{\phi}}_{21}}=\frac{f}{g} \end{gather}

母集団平均発症リスク比

\begin{gather} {\mathrm{RR}}_A=\frac{\phi_{1\bullet }}{\phi_{\bullet 1}}=\frac{\phi_{11}+\phi_{12}}{\phi_{11}+\phi_{21}}\\ {\mathrm{\widehat{RR}}}_A=\frac{{\hat{\phi}}_{1\bullet }}{{\hat{\phi}}_{\bullet 1}}=\frac{{\hat{\phi}}_{11}+{\hat{\phi}}_{12}}{{\hat{\phi}}_{11}+{\hat{\phi}}_{21}}=\frac{e+f}{e+g}=\frac{n_{1\bullet }}{n_{\bullet 1}} \end{gather}

検定仮説

帰無仮説

周辺化同質性の帰無仮説 \begin{gather} H_0:\phi_{1\bullet }=\phi_{\bullet 1} \end{gather} これは、対称性の帰無仮説 \begin{gather} H_0:\phi_{12}=\phi_{21} \end{gather} と同値である。

対立仮説

①両側仮説 \begin{gather} H_1:\phi_{12} \neq \phi_{21} \end{gather} ②右側仮説 \begin{align} H_1:\phi_{12} \gt \phi_{21} \end{align} ③左側仮説 \begin{align} H_1:\phi_{12} \lt \phi_{21} \end{align}

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.236

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ