ケース・コントロール研究(マッチングあり・層化あり)

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A052】ケース・コントロール研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングあり、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

分割表の形式

指示変数 j を任意の被験者の発症状況を表す変数 j={1Disease(D)0Not disease(D¯) とし、 発症者1人に対し、背景因子の水準が同程度の非発症者を1人マッチングし、計2人のペアを作る。そして、調整したい交絡因子の水準にもとづいて、互いに独立な K 個の層に層化する。
このペアの総数(サンプルサイズ)を Nk とし、曝露状況について調べる。 指示変数 Yi 番目のペアの j 番目のメンバーの曝露状況を表す変数 yijk={1Exposed(E)0Unexposed(E¯) とする。

このとき、各ペアの発症・曝露状況は、 発症者・非発症者=①曝露あり・曝露あり、②曝露あり・曝露なし、
③曝露なし・曝露あり、④曝露なし・曝露なし
(yi1k,yi0k)=(1,1),(1,0),(0,1),(0,0) のいずれかに分類される。 それぞれの発症・曝露状況に該当するペアの数を ek(=n11k)fk(=n12k)gk(=n21k)hk(=n22k) とする。

また、周辺度数として、 ①発症者が曝露したペア、②発症者が曝露しなかったペア、
③非発症者が曝露したペア、④非発症者が曝露しなかったペア
が得られる。 それぞれの合計ペア数を nDEk(=n1k)nDE¯k(=n0k)nD¯Ek(=n1k)nD¯E¯k(=n0k) とする。

表1 ペア・マッチングを行ったケース・コントロール研究に関する
2×2 分割表(第 k 層の観測値)
非発症者
(D¯)
合計
曝露あり
(E)
曝露なし
(E¯)
発症者
(D)
曝露あり
(E)
ek
(=n11k)
fk
(=n12k)
nDEk
(=n1k)
曝露なし
(E¯)
gk
(=n21k)
hk
(=n22k)
nDE¯k
(=n0k)
合計 nD¯Ek
(=n1k)
nD¯E¯k
(=n0k)
Nk

統計モデル

各セルの観測値 nk=(ekfkgkhk) が四項分布

nkMN(Nk,ϕk)ϕk=(ϕ11kϕ12kϕ21kϕ22k) に従うとする。

マッチングを行ったケース・コントロール研究に関する
2×2 分割表(第 k 層の統計モデル)
非発症者
(D¯)
合計
曝露あり
(E)
曝露なし
(E¯)
発症者
(D)
曝露あり
(E)
ϕ11k ϕ12k ϕDEk
(=π1k)
曝露なし
(E¯)
ϕ21k ϕ22k ϕDE¯k
(=π0k)
合計 ϕD¯Ek
(=ϕ1k)
ϕD¯E¯k
(=ϕ0k)
1

四項尤度

L(ϕk)=Nk!ek!fk!gk!hk!ϕ11ekϕ12fkϕ21gkϕ22hk

曝露効果の指標

標本比率

ϕ^11k=ekNkϕ^12k=fkNkϕ^21k=gkNkϕ^22k=hkNk

条件付き周辺曝露オッズ比

ORzk=ϕ12k|zϕ21k|z

条件付き曝露オッズ比

ORCk=ϕ12kϕ21kOR^Ck=ϕ^12kϕ^21k=fkgk

母集団平均発症リスク比

RRAk=ϕ1kϕ1k=ϕ11k+ϕ12kϕ11k+ϕ21kRR^Ak=ϕ^1kϕ^1k=ϕ^11k+ϕ^12kϕ^11k+ϕ^21k=ek+fkek+gk=n1kn1k

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.242-245

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ