ケース・コントロール研究（マッチングあり・層化あり）-あるノマドの知の旅路～数学・統計学への道

ケース・コントロール研究（マッチングあり・層化あり）

公開日：更新日：

本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングあり、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
曝露（発症）状況を表す右下の添え字は、「0」である場合（$n_0,\pi_0$ など）や「2」である場合（$n_2,\pi_2$ など）がありますが、どちらも「非曝露群（コントロール群）」を表しています。

分割表の形式

指示変数 $j$ を任意の被験者の発症状況を表す変数 \begin{align} j= \left\{\begin{matrix}1&\mathrm{Disease} \left(D\right)\\0&\mathrm{Not\ disease}(\bar{D})\\\end{matrix}\right. \end{align} とし、発症者1人に対し、背景因子の水準が同程度の非発症者を1人マッチングし、計2人のペアを作る。そして、調整したい交絡因子の水準にもとづいて、互いに独立な $K$ 個の層に層化する。
このペアの総数（サンプルサイズ）を \begin{align} N_k \end{align} とし、曝露状況について調べる。指示変数 $Y$ を $i$ 番目のペアの $j$ 番目のメンバーの曝露状況を表す変数 \begin{align} y_{ijk}= \left\{\begin{matrix}1&\mathrm{Exposed} \left(E\right)\\0&\mathrm{Unexposed}(\bar{E})\\\end{matrix}\right. \end{align} とする。

このとき、各ペアの発症・曝露状況は、発症者・非発症者＝①曝露あり・曝露あり、②曝露あり・曝露なし、
③曝露なし・曝露あり、④曝露なし・曝露なし \begin{gather} \left(y_{i1k},y_{i0k}\right)= \left(1,1\right), \left(1,0\right), \left(0,1\right), \left(0,0\right) \end{gather} のいずれかに分類される。それぞれの発症・曝露状況に該当するペアの数を \begin{gather} e_k \left(=n_{11k}\right) \quad f_k \left(=n_{12k}\right) \quad g_k \left(=n_{21k}\right) \quad h_k \left(=n_{22k}\right) \end{gather} とする。

また、周辺度数として、 ①発症者が曝露したペア、②発症者が曝露しなかったペア、
③非発症者が曝露したペア、④非発症者が曝露しなかったペアが得られる。それぞれの合計ペア数を \begin{gather} n_{DEk} \left(=n_{1\bullet k}\right) \quad n_{D\bar{E}k} \left(=n_{0\bullet k}\right) \quad n_{\bar{D}Ek} \left(=n_{\bullet 1k}\right) \quad n_{\bar{D}\bar{E}k} \left(=n_{\bullet 0k}\right) \end{gather} とする。

表1 ペア・マッチングを行ったケース・コントロール研究に関する
$2\times2$ 分割表（第 $k$ 層の観測値）
		非発症者 $(\bar{D})$		合計
		曝露あり $(E)$	曝露なし $(\bar{E})$	合計
発症者 $(D)$	曝露あり $(E)$	$e_k$ $ \left(=n_{11k}\right)$	$f_k$ $ \left(=n_{12k}\right)$	$n_{DEk}$ $ \left(=n_{1\bullet k}\right)$
発症者 $(D)$	曝露なし $(\bar{E})$	$g_k$ $ \left(=n_{21k}\right)$	$h_k$ $ \left(=n_{22k}\right)$	$n_{D\bar{E}k}$ $ \left(=n_{0\bullet k}\right)$
合計		$n_{\bar{D}Ek}$ $ \left(=n_{\bullet 1k}\right)$	$n_{\bar{D}\bar{E}k}$ $ \left(=n_{\bullet 0k}\right)$	$N_k$

統計モデル

各セルの観測値 \begin{align} \boldsymbol{n}_\boldsymbol{k}= \left(\begin{matrix}e_k\\f_k\\g_k\\h_k\\\end{matrix}\right) \end{align} が四項分布

\begin{gather} \boldsymbol{n}_\boldsymbol{k} \sim \mathrm{MN} \left(N_k,\boldsymbol{\phi}_\boldsymbol{k}\right)\\ \boldsymbol{\phi}_\boldsymbol{k}= \left(\begin{matrix}\phi_{11k}\\\phi_{12k}\\\phi_{21k}\\\phi_{22k}\\\end{matrix}\right) \end{gather} に従うとする。

マッチングを行ったケース・コントロール研究に関する
$2\times2$ 分割表（第 $k$ 層の統計モデル）
		非発症者 $(\bar{D})$		合計
		曝露あり $(E)$	曝露なし $(\bar{E})$	合計
発症者 $(D)$	曝露あり $(E)$	$\phi_{11k}$	$\phi_{12k}$	$\phi_{DEk}$ $ \left(=\pi_{1\bullet k}\right)$
発症者 $(D)$	曝露なし $(\bar{E})$	$\phi_{21k}$	$\phi_{22k}$	$\phi_{D\bar{E}k}$ $ \left(=\pi_{0\bullet k}\right)$
合計		$\phi_{\bar{D}Ek}$ $ \left(=\phi_{\bullet 1k}\right)$	$\phi_{\bar{D}\bar{E}k}$ $ \left(=\phi_{\bullet 0k}\right)$	$1$

四項尤度

\begin{align} L \left(\boldsymbol{\phi}_\boldsymbol{k}\right)=\frac{N_k!}{e_k!f_k!g_k!h_k!}\phi_{11}^{e_k}\phi_{12}^{f_k}\phi_{21}^{g_k}\phi_{22}^{h_k} \end{align}

曝露効果の指標

標本比率

\begin{gather} {\hat{\phi}}_{11k}=\frac{e_k}{N_k} \quad {\hat{\phi}}_{12k}=\frac{f_k}{N_k}\\ {\hat{\phi}}_{21k}=\frac{g_k}{N_k} \quad {\hat{\phi}}_{22k}=\frac{h_k}{N_k} \end{gather}

条件付き周辺曝露オッズ比

\begin{gather} {\mathrm{OR}}_{zk}=\frac{\phi_{ \left.12k\right|z}}{\phi_{ \left.21k\right|z}}\\ \end{gather}

条件付き曝露オッズ比

\begin{gather} {\mathrm{OR}}_{Ck}=\frac{\phi_{12k}}{\phi_{21k}}\\ {\mathrm{\widehat{OR}}}_{Ck}=\frac{{\hat{\phi}}_{12k}}{{\hat{\phi}}_{21k}}=\frac{f_k}{g_k} \end{gather}

母集団平均発症リスク比

\begin{gather} {\mathrm{RR}}_{Ak}=\frac{\phi_{1\bullet k}}{\phi_{\bullet 1k}}=\frac{\phi_{11k}+\phi_{12k}}{\phi_{11k}+\phi_{21k}}\\ {\mathrm{\widehat{RR}}}_{Ak}=\frac{{\hat{\phi}}_{1\bullet k}}{{\hat{\phi}}_{\bullet 1k}}=\frac{{\hat{\phi}}_{11k}+{\hat{\phi}}_{12k}}{{\hat{\phi}}_{11k}+{\hat{\phi}}_{21k}}=\frac{e_k+f_k}{e_k+g_k}=\frac{n_{1\bullet k}}{n_{\bullet 1k}} \end{gather}

参考文献

ジョン・ラチン著, 宮岡悦良監訳, 遠藤輝, 黒沢健, 下川朝有, 寒水孝司訳. 医薬データのための統計解析. 共立出版, 2020, p.242-245

ケース・コントロール研究（マッチングあり・層化あり）

分割表の形式

統計モデル

四項尤度

曝露効果の指標

標本比率

条件付き周辺曝露オッズ比

条件付き曝露オッズ比

母集団平均発症リスク比

参考文献

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

ケース・コントロール研究（マッチングあり・層化あり）

分割表の形式

統計モデル

四項尤度

曝露効果の指標

標本比率

条件付き周辺曝露オッズ比

条件付き曝露オッズ比

母集団平均発症リスク比

参考文献

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ブログアーカイブ