ケース・コントロール研究(マッチングなし・層化あり)

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A052】ケース・コントロール研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、ケース・コントロール研究の研究デザインのうち、①マッチングなし、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

周辺解析

分割表の形式

発症群と非発症群の観察対象人数をそれぞれ、 n1n0N=n1+n0 曝露者と非曝露者の人数をそれぞれ、 m1m0N=m1+m0 発症群と非発症群の曝露人数をそれぞれ、 ab 発症群と非発症群の非曝露人数をそれぞれ、 cd とする。

表1 ケース・コントロール研究に関する 2×2 分割表(観測値)
曝露あり
(D)
曝露なし
(D¯)
合計
ケース群
(E)
a c n1
コントロール群
(E¯)
b d n0
合計 m1 m0 N

統計モデル①:積二項モデル

発症群と非発症群の曝露人数 a,b が互いに独立に、
試行回数がそれぞれ n1n0 母比率(曝露確率)がそれぞれ ϕ1=P(E|D)ϕ0=P(E¯|D) である 二項分布 aB(n1,ϕ1)bB(n0,ϕ0) に従うとする。

表2 ケース・コントロール研究に関する 2×2 分割表(統計モデル)
曝露あり
(D)
曝露なし
(D¯)
合計
ケース群
(E)
ϕ1 1ϕ1 1
コントロール群
(E¯)
ϕ0 1ϕ0 1

統計モデル②:超幾何分布モデル

周辺度数 n1n0m1m0 が固定されているという条件の下で、 発症群の曝露人数 a が超幾何分布 aHG(N,n1,m1) に従うとする。

曝露効果の指標

曝露オッズ

OD1=ϕ11ϕ1OD0=ϕ01ϕ0OD^1=ϕ^11ϕ^1=acOD^0=ϕ^01ϕ^0=bd

曝露オッズ比

δ=OR=OD1OD0=ϕ11ϕ11ϕ0ϕ0δ^=OR^=OD^1OD^0=ϕ^11ϕ^11ϕ^0ϕ^0=adbc

交絡の調整

しかし、このような単純な周辺解析を行うと、交絡の影響により、誤った結論に陥る可能性がある。そのため、「対象者の限定」の原理にもとづいて交絡因子の影響を取り除くために、得られたデータを交絡因子の水準にもとづいて、互いに独立な K 個の層に層化する。

層別解析

分割表の形式

k 層における発症群と非発症群の観察対象人数をそれぞれ、 n1kn0kNk=n1k+n0k 曝露者と非曝露者の人数をそれぞれ、 m1km0kNk=m1k+m0k 発症群と非発症群の曝露人数をそれぞれ、 akbk 発症群と非発症群の非曝露人数をそれぞれ、 ckdk とする。

表3 ケース・コントロール研究に関する 2×2 分割表(第 k 層の観測値)
曝露あり
(D)
曝露なし
(D¯)
合計
ケース群
(E)
ak ck n1k
コントロール群
(E¯)
bk dk n0k
合計 m1k m0k Nk

ただし、 a=k=1Kakb=k=1Kbkc=k=1Kckd=k=1Kdkm1=k=1Km1km0=k=1Km0kn1=k=1Kn1kn0=k=1Kn0kN=k=1KNk

統計モデル①:積二項モデル

k 層の発症群と非発症群の曝露人数 ak,bk が互いに独立に、 試行回数がそれぞれ n1kn0k 母比率(曝露確率)がそれぞれ ϕ1k=P(E|D)ϕ0k=P(E¯|D) である 二項分布 akB(n1k,ϕ1k)bkB(n0k,ϕ0k) に従うとする。

表4 ケース・コントロール研究に関する 2×2 分割表(第 k 層の積二項モデル)
曝露あり
(D)
曝露なし
(D¯)
合計
ケース群
(E)
ϕ1k 1ϕ1k 1
コントロール群
(E¯)
ϕ0k 1ϕ0k 1

積二項尤度

H0:ϕ1k=ϕ0k(=ϕk)vs.H1:ϕ1kϕ0k として、k 層の尤度関数 L1k(ϕ1k,ϕ0k)=n1kCakϕ1kak(1ϕ1k)n1kakn0kCbkϕ0kbk(1ϕ0k)n0kbkL0k(ϕk)=n1Cakn0Cbkϕkak+bk(1ϕk)n1k+n0kakbk 各層の発症人数が互いに独立なとき、全体の尤度関数 L1(ϕ1,ϕ0)=k=1Kn1kCakϕ1kak(1ϕ1k)n1kakn0kCbkϕ0kbk(1ϕ0k)n0kbkL0(ϕ)=k=1Kn1Cakn0Cbkϕkak+bk(1ϕk)n1k+n0kakbk

統計モデル②:超幾何分布モデル

各層の周辺度数 n1kn0km1km0k が固定されているという条件の下で、 各層の曝露群の発症人数 ak が超幾何分布 akHG(Nk,n1k,m1k) に従うとする。

超幾何尤度

H0:φk=1vs.H1:φk1φk=ORk として、 L1k(φk)=n1Cakn0Cm1akφkaki=aklakun1Cin0Cm1iφkiL0k(φk)=n1kCakNkn1kCm1kakNkCm1k=n1k!n0k!m1k!m0k!Nk!ak!bk!ck!dk! 各層の発症人数が互いに独立なとき、全体の尤度関数 L1(φ)=k=1Kn1Cakn0Cm1akφkaki=aklakun1Cin0Cm1iφkiL0(φ)=k=1Kn1k!n0k!m1k!m0k!Nk!ak!bk!ck!dk!

曝露効果の指標

発生割合

ϕ1kϕ0kϕ^1k=akn1kϕ^0=bkn0k

曝露オッズ

OD1k=ϕ1k1ϕ1kOD0k=ϕ0k1ϕ0kOD^1k=ϕ^1k1ϕ^1k=akckOD^0k=ϕ^0k1ϕ^0k=bkdk

曝露オッズ比

δ=ORk=OD1kOD0k=ϕ1k1ϕ1k1ϕ0kϕ0kδ^=OR^k=OD^1kOD^0k=ϕ^1k1ϕ^1k1ϕ^0kϕ^0k=akdkbkck

検定仮説

特に、層別解析に対するコクラン検定やマンテル・ヘンツェル検定を想定する場合、 各層に共通した曝露効果がある との前提から始める。

帰無仮説

帰無仮説は、 全層共通のオッズ比が1である すなわち、すべての k=1,2,,K に対し、 H0:φk=1 これは、 すべての層で発症群と非発症群の曝露確率が等しい H0:ϕ1k=ϕ0k という仮説と同値である。

対立仮説

対立仮説は、 1ではない全層共通のオッズ比が存在する すなわち、すべての k=1,2,,K に対し、 H1:φk=φ(1) これは、 各層の発症群と非発症群の曝露確率は等しくない H0:ϕ1kϕ0k という仮説と同値である。

参考文献

  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.260

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ