横断研究・コホート研究【有病率・発生割合】(マッチングなし・層化なし)

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A051】コホート研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、横断研究・コホート研究の研究デザインのうち、①有病率(横断研究)や発生割合(コホート研究)を曝露効果の指標とする、②マッチングなし、③層化なしのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

分割表の形式

曝露群と非曝露群の観察対象人数をそれぞれ、 \begin{gather} n_1 \quad n_0\\ N=n_1+n_0 \end{gather} 発症者と非発症者の人数をそれぞれ、 \begin{gather} m_1 \quad m_0\\ N=m_1+m_0 \end{gather} 曝露群と非曝露群の発症人数をそれぞれ、 \begin{gather} a \quad b \end{gather} 曝露群と非曝露群の非発症人数をそれぞれ、 \begin{gather} c \quad d \end{gather} とする。

表1 横断研究・コホート研究に関する $2\times2$ 分割表(観測値)
発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$a$ $c$ $n_1$
非曝露群
$(\bar{E})$
$b$ $d$ $n_0$
合計 $m_1$ $m_0$ $N$

統計モデル①:積二項モデル

曝露群と非曝露群の発症人数 $a,b$ が互いに独立に、試行回数がそれぞれ \begin{align} n_1 \quad n_0 \end{align} 母比率(発症確率)がそれぞれ \begin{align} \pi_1=P \left(D\middle| E\right) \quad \pi_0=P \left(D\middle|\bar{E}\right) \end{align} である 二項分布 \begin{align} a \sim \mathrm{B} \left(n_1,\pi_1\right) \quad b \sim \mathrm{B} \left(n_0,\pi_0\right) \end{align} に従うとする。

表2-1 横断研究・コホート研究に関する $2\times2$ 分割表(積二項モデル)
発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$\pi_1$ $1-\pi_1$ $1$
非曝露群
$(\bar{E})$
$\pi_0$ $1-\pi_0$ $1$

積二項尤度

\begin{align} H_0:\pi_1=\pi_0 \left(=\pi\right) \quad \mathrm{vs.} \quad H_1:\pi_1 \neq \pi_0 \end{align} として、 \begin{gather} L_1 \left(\pi_1,\pi_0\right)={}_{n_1}C_a\pi_1^a \left(1-\pi_1\right)^{n_1-a} \cdot {}_{n_0}C_b\pi_0^b \left(1-\pi_0\right)^{n_0-b}\\ L_0 \left(\pi\right)={}_{n_1}C_a \cdot {}_{n_0}C_b \cdot \pi^{a+b} \left(1-\pi\right)^{n_1+n_0-a-b} \end{gather}

統計モデル②:超幾何分布モデル

周辺度数 \begin{gather} n_1 \quad n_0 \quad m_1 \quad m_0 \end{gather} が固定されているという条件の下で、 曝露群の発症人数 $a$ が超幾何分布 \begin{align} a \sim \mathrm{HG} \left(N,n_1,m_1\right) \end{align} に従うとする。

超幾何尤度

\begin{gather} H_0:\varphi=1 \quad \mathrm{vs.} \quad H_1:\varphi \neq 1\\ \varphi=\mathrm{OR} \end{gather} として、 \begin{align} L_1 \left(\varphi\right)&=\frac{{}_{n_1}C_a \cdot {}_{n_0}C_{m_1-a} \cdot \varphi^a}{\sum_{i=a_l}^{a_u}{{}_{n_1}C_i \cdot {}_{n_0}C_{m_1-i} \cdot \varphi^i}}\\ L_0 \left(\varphi\right)&=\frac{{}_{n_1}C_a \cdot {}_{N-n_1}C_{m_1-a}}{{}_{N}C_{m_1}}\\ &=\frac{n_1!n_0!m_1!m_0!}{N!a!b!c!d!} \end{align}

統計モデル③:四項分布モデル

各セルの観測値 \begin{align} \boldsymbol{n}= \left(\begin{matrix}a\\b\\c\\d\\\end{matrix}\right) \end{align} が四項分布

\begin{gather} \boldsymbol{n} \sim \mathrm{MN} \left(N,\boldsymbol{\pi}\right)\\ \boldsymbol{\pi}= \left(\begin{matrix}\pi_{11}\\\pi_{12}\\\pi_{21}\\\pi_{22}\\\end{matrix}\right) \end{gather} に従うとする。

表2-2 横断研究・コホート研究に関する $2\times2$ 分割表(四項分布モデル)
発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$\pi_{11}$ $\pi_{12}$ $\pi_E$
非曝露群
$(\bar{E})$
$\pi_{21}$ $\pi_{22}$ $1-\pi_E$
合計 $\pi_D$ $1-\pi_D$ $1$

四項尤度

\begin{align} L \left(\boldsymbol{\pi}\right)=\frac{N!}{e!f!g!h!}\pi_{11}^e\pi_{12}^f\pi_{21}^g\pi_{22}^h \end{align}

曝露効果の指標

発生割合

\begin{gather} \pi_1 \quad \pi_0\\ {\hat{\pi}}_1=p_1=\frac{a}{n_1} \quad {\hat{\pi}}_0=p_0=\frac{b}{n_0} \end{gather}

発生オッズ

\begin{gather} {\mathrm{OD}}_1=\frac{\pi_1}{1-\pi_1} \quad {\mathrm{OD}}_0=\frac{\pi_0}{1-\pi_0}\\ {\mathrm{\widehat{OD}}}_1=\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1}=\frac{a}{c} \quad {\mathrm{\widehat{OD}}}_0=\frac{{\hat{\pi}}_0}{1-{\hat{\pi}}_0}=\frac{b}{d} \end{gather}

発生リスク差

\begin{gather} \delta=\mathrm{RD}=\pi_1-\pi_0\\ \hat{\delta}=\mathrm{\widehat{RD}}={\hat{\pi}}_1-{\hat{\pi}}_0=\frac{a}{n_1}-\frac{b}{n_0} \end{gather}

発生リスク比

\begin{gather} \delta=\mathrm{RR}=\frac{\pi_1}{\pi_0}\\ \hat{\delta}=\mathrm{\widehat{RR}}=\frac{{\hat{\pi}}_1}{{\hat{\pi}}_0}=\frac{an_0}{bn_1} \end{gather}

発生オッズ比

\begin{gather} \delta=\mathrm{OR}=\frac{{\mathrm{OD}}_1}{{\mathrm{OD}}_0}=\frac{\pi_1}{1-\pi_1} \cdot \frac{1-\pi_0}{\pi_0}\\ \hat{\delta}=\mathrm{\widehat{OR}}=\frac{{\mathrm{\widehat{OD}}}_1}{{\mathrm{\widehat{OD}}}_0}=\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1} \cdot \frac{1-{\hat{\pi}}_0}{{\hat{\pi}}_0}=\frac{ad}{bc} \end{gather}

検定仮説

帰無仮説

\begin{gather} H_0:\pi_1=\pi_0 \end{gather}

対立仮説

①両側仮説 \begin{gather} H_1:\pi_1 \neq \pi_0 \end{gather} ②右側仮説 \begin{align} H_1:\pi_1 \gt \pi_0 \end{align} ③左側仮説 \begin{align} H_1:\pi_1 \lt \pi_0 \end{align}

人口寄与危険割合

母集団全体における曝露の割合と非曝露の割合を \begin{gather} \alpha_1 \quad \alpha_0=1-\alpha_1\\ {\hat{\alpha}}_1=\frac{n_1}{N} \end{gather} 全体の発症確率を \begin{gather} \pi_{\bullet }=\alpha_1\pi_1+\alpha_0\pi_0\\ {\hat{\pi}}_{\bullet }=\frac{m_1}{N} \end{gather} とすると、

表3 横断研究・コホート研究に関する $2\times2$ 分割表(統計モデル)
発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$\alpha_1\pi_1$ $\alpha_1 \left(1-\pi_1\right)$ $\alpha_1$
非曝露群
$(\bar{E})$
$\alpha_0\pi_0$ $\alpha_0 \left(1-\pi_0\right)$ $\alpha_0$
$\pi_{\bullet }$ $1-\pi_{\bullet }$ $1$

母集団寄与危険割合は、 \begin{align} \mathrm{\mathrm{PAR}}&=\frac{\pi_{\bullet }-\pi_0}{\pi_{\bullet }}\\ &=\frac{\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}{1+\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}\\ &=\frac{\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}{\alpha_1\mathrm{\mathrm{RR}+} \alpha_0}\\ &=\frac{n_1\pi_1-n_1\pi_0}{\pi_{\bullet }N} \end{align} 一致推定量は、 \begin{align} \mathrm{\widehat{PAR}}&=\frac{{\hat{\alpha}}_1 \left(\mathrm{\widehat{RR}}-1\right)}{1+{\hat{\alpha}}_1 \left(\mathrm{\widehat{RR}}-1\right)}\\ &=\frac{a-n_1{\hat{\pi}}_0}{m_1} \end{align}

参考文献

  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.233
  • 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック. 朝倉書店, 2018, p.503
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.20

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ