横断研究・コホート研究【有病率・発生割合】(マッチングなし・層化あり)

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A051】コホート研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、横断研究・コホート研究の研究デザインのうち、①有病率(横断研究)や発生割合(コホート研究)を曝露効果の指標とする、②マッチングなし、③層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

周辺解析

分割表の形式

曝露群と非曝露群の観察対象人数をそれぞれ、 n1n0N=n1+n0 発症者と非発症者の人数をそれぞれ、 m1m0N=m1+m0 曝露群と非曝露群の発症人数をそれぞれ、 ab 曝露群と非曝露群の非発症人数をそれぞれ、 cd とする。

表1 横断研究・コホート研究に関する 2×2 分割表(観測値)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
a c n1
非曝露群
(E¯)
b d n0
合計 m1 m0 N

統計モデル①:積二項モデル

曝露群と非曝露群の発症人数 a,b が互いに独立に、
試行回数がそれぞれ n1n0 母比率(発症確率)がそれぞれ π1=P(D|E)π0=P(D|E¯) である 二項分布 aB(n1,π1)bB(n0,π0) に従うとする。

表2 横断研究・コホート研究に関する 2×2 分割表(統計モデル)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
π1 1π1 1
非曝露群
(E¯)
π0 1π0 1

統計モデル②:超幾何分布モデル

周辺度数 n1n0m1m0 が固定されているという条件の下で、 曝露群の発症人数 a が超幾何分布 aHG(N,n1,m1) に従うとする。

曝露効果の指標

発生割合

π1π0π^1=an1π^0=bn0

発生オッズ

OD1=π11π1OD0=π01π0OD^1=π^11π^1=acOD^0=π^01π^0=bd

発生リスク差

δ=RD=π1π0δ^=RD^=π^1π^0=an1bn0

発生リスク比

δ=RR=π1π0δ^=RR^=π^1π^0=an0bn1

発生オッズ比

δ=OR=OD1OD0=π11π11π0π0δ^=OR^=OD^1OD^0=π^11π^11π^0π^0=adbc

交絡の調整

しかし、このような単純な周辺解析を行うと、交絡の影響により、誤った結論に陥る可能性がある。そのため、「対象者の限定」の原理にもとづいて交絡因子の影響を取り除くために、得られたデータを交絡因子の水準にもとづいて、互いに独立な K 個の層に層化する。

層別解析

分割表の形式

k 層における曝露群と非曝露群の観察対象人数をそれぞれ、 n1kn0kNk=n1k+n0k 発症者と非発症者の人数をそれぞれ、 m1km0kNk=m1k+m0k 曝露群と非曝露群の発症人数をそれぞれ、 akbk 曝露群と非曝露群の非発症人数をそれぞれ、 ckdk とする。

表3 横断研究・コホート研究に関する 2×2 分割表(第 k 層の観測値)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
ak ck n1k
非曝露群
(E¯)
bk dk n0k
合計 m1k m0k Nk

ただし、 a=k=1Kakb=k=1Kbkc=k=1Kckd=k=1Kdkm1=k=1Km1km0=k=1Km0kn1=k=1Kn1kn0=k=1Kn0kN=k=1KNk

統計モデル①:積二項モデル

k 層の曝露群と非曝露群の発症人数 ak,bk が互いに独立に、 試行回数がそれぞれ n1kn0k 母比率(発症確率)がそれぞれ π1k=P(D|E)π0k=P(D|E¯) である 二項分布 akB(n1k,π1k)bkB(n0k,π0k) に従うとする。

表4 横断研究・コホート研究に関する 2×2 分割表(第 k 層の統計モデル)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
π1k 1π1k 1
非曝露群
(E¯)
π0k 1π0k 1

積二項尤度

H0:π1k=π0k(=πk)vs.H1:π1kπ0k として、k 層の尤度関数 L1k(π1k,π0k)=n1kCakπ1kak(1π1k)n1kakn0kCbkπ0kbk(1π0k)n0kbkL0k(πk)=n1Cakn0Cbkπkak+bk(1πk)n1k+n0kakbk 各層の発症人数が互いに独立なとき、全体の尤度関数 L1(π1,π0)=k=1Kn1kCakπ1kak(1π1k)n1kakn0kCbkπ0kbk(1π0k)n0kbkL0(π)=k=1Kn1Cakn0Cbkπkak+bk(1πk)n1k+n0kakbk

統計モデル②:超幾何分布モデル

各層の周辺度数 n1kn0km1km0k が固定されているという条件の下で、 各層の曝露群の発症人数 ak が超幾何分布 akHG(Nk,n1k,m1k) に従うとする。

超幾何尤度

H0:φk=1vs.H1:φk1φk=ORk として、 L1k(φk)=n1Cakn0Cm1akφkaki=aklakun1Cin0Cm1iφkiL0k(φk)=n1kCakNkn1kCm1kakNkCm1k=n1k!n0k!m1k!m0k!Nk!ak!bk!ck!dk! 各層の発症人数が互いに独立なとき、全体の尤度関数 L1(φ)=k=1Kn1Cakn0Cm1akφkaki=aklakun1Cin0Cm1iφkiL0(φ)=k=1Kn1k!n0k!m1k!m0k!Nk!ak!bk!ck!dk!

曝露効果の指標

発生割合

π1kπ0kπ^1k=akn1kπ^0=bkn0k

発生オッズ

OD1k=π1k1π1kOD0k=π0k1π0kOD^1k=π^1k1π^1k=akckOD^0k=π^0k1π^0k=bkdk

発生リスク差

δ=RDk=π1kπ0kδ^=RD^k=π^1kπ^0k=akn1kbkn0k

発生リスク比

δ=RRk=π1π0δ^=RR^k=π^1kπ^0k=akn0kbkn1k

発生オッズ比

δ=ORk=OD1kOD0k=π1k1π1k1π0kπ0kδ^=OR^k=OD^1kOD^0k=π^1k1π^1k1π^0kπ^0k=akdkbkck

検定仮説

特に、層別解析に対するコクラン検定やマンテル・ヘンツェル検定を想定する場合、 各層に共通した曝露効果がある との前提から始める。

帰無仮説

帰無仮説は、 全層共通のオッズ比が1である すなわち、すべての k=1,2,,K に対し、 H0:φk=1 これは、 すべての層で曝露群と非曝露群の発症確率が等しい H0:π1k=π0k という仮説と同値である。

対立仮説

対立仮説は、 1ではない全層共通のオッズ比が存在する すなわち、すべての k=1,2,,K に対し、 H1:φk=φ(1) これは、 各層の曝露群と非曝露群の発症確率は等しくない H0:π1kπ0k という仮説と同値である。

参考文献

  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.249
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.129

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ