本稿では、横断研究・コホート研究の研究デザインのうち、①有病率(横断研究)や発生割合(コホート研究)を曝露効果の指標とする、②マッチングなし、③層化なしのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
分割表の形式
曝露群と非曝露群の観察対象人数をそれぞれ、 \begin{gather} n_1 \quad n_0\\ N=n_1+n_0 \end{gather} 発症者と非発症者の人数をそれぞれ、 \begin{gather} m_1 \quad m_0\\ N=m_1+m_0 \end{gather} 曝露群と非曝露群の発症人数をそれぞれ、 \begin{gather} a \quad b \end{gather} 曝露群と非曝露群の非発症人数をそれぞれ、 \begin{gather} c \quad d \end{gather} とする。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $a$ | $c$ | $n_1$ |
非曝露群 $(\bar{E})$ | $b$ | $d$ | $n_0$ |
合計 | $m_1$ | $m_0$ | $N$ |
統計モデル①:積二項モデル
曝露群と非曝露群の発症人数 $a,b$ が互いに独立に、試行回数がそれぞれ \begin{align} n_1 \quad n_0 \end{align} 母比率(発症確率)がそれぞれ \begin{align} \pi_1=P \left(D\middle| E\right) \quad \pi_0=P \left(D\middle|\bar{E}\right) \end{align} である 二項分布 \begin{align} a \sim \mathrm{B} \left(n_1,\pi_1\right) \quad b \sim \mathrm{B} \left(n_0,\pi_0\right) \end{align} に従うとする。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $\pi_1$ | $1-\pi_1$ | $1$ |
非曝露群 $(\bar{E})$ | $\pi_0$ | $1-\pi_0$ | $1$ |
積二項尤度
\begin{align} H_0:\pi_1=\pi_0 \left(=\pi\right) \quad \mathrm{vs.} \quad H_1:\pi_1 \neq \pi_0 \end{align} として、 \begin{gather} L_1 \left(\pi_1,\pi_0\right)={}_{n_1}C_a\pi_1^a \left(1-\pi_1\right)^{n_1-a} \cdot {}_{n_0}C_b\pi_0^b \left(1-\pi_0\right)^{n_0-b}\\ L_0 \left(\pi\right)={}_{n_1}C_a \cdot {}_{n_0}C_b \cdot \pi^{a+b} \left(1-\pi\right)^{n_1+n_0-a-b} \end{gather}
統計モデル②:超幾何分布モデル
周辺度数 \begin{gather} n_1 \quad n_0 \quad m_1 \quad m_0 \end{gather} が固定されているという条件の下で、 曝露群の発症人数 $a$ が超幾何分布 \begin{align} a \sim \mathrm{HG} \left(N,n_1,m_1\right) \end{align} に従うとする。
超幾何尤度
\begin{gather} H_0:\varphi=1 \quad \mathrm{vs.} \quad H_1:\varphi \neq 1\\ \varphi=\mathrm{OR} \end{gather} として、 \begin{align} L_1 \left(\varphi\right)&=\frac{{}_{n_1}C_a \cdot {}_{n_0}C_{m_1-a} \cdot \varphi^a}{\sum_{i=a_l}^{a_u}{{}_{n_1}C_i \cdot {}_{n_0}C_{m_1-i} \cdot \varphi^i}}\\ L_0 \left(\varphi\right)&=\frac{{}_{n_1}C_a \cdot {}_{N-n_1}C_{m_1-a}}{{}_{N}C_{m_1}}\\ &=\frac{n_1!n_0!m_1!m_0!}{N!a!b!c!d!} \end{align}
統計モデル③:四項分布モデル
各セルの観測値 \begin{align} \boldsymbol{n}= \left(\begin{matrix}a\\b\\c\\d\\\end{matrix}\right) \end{align} が四項分布
\begin{gather} \boldsymbol{n} \sim \mathrm{MN} \left(N,\boldsymbol{\pi}\right)\\ \boldsymbol{\pi}= \left(\begin{matrix}\pi_{11}\\\pi_{12}\\\pi_{21}\\\pi_{22}\\\end{matrix}\right) \end{gather} に従うとする。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $\pi_{11}$ | $\pi_{12}$ | $\pi_E$ |
非曝露群 $(\bar{E})$ | $\pi_{21}$ | $\pi_{22}$ | $1-\pi_E$ |
合計 | $\pi_D$ | $1-\pi_D$ | $1$ |
四項尤度
\begin{align} L \left(\boldsymbol{\pi}\right)=\frac{N!}{e!f!g!h!}\pi_{11}^e\pi_{12}^f\pi_{21}^g\pi_{22}^h \end{align}
曝露効果の指標
発生割合
\begin{gather} \pi_1 \quad \pi_0\\ {\hat{\pi}}_1=p_1=\frac{a}{n_1} \quad {\hat{\pi}}_0=p_0=\frac{b}{n_0} \end{gather}
発生オッズ
\begin{gather} {\mathrm{OD}}_1=\frac{\pi_1}{1-\pi_1} \quad {\mathrm{OD}}_0=\frac{\pi_0}{1-\pi_0}\\ {\mathrm{\widehat{OD}}}_1=\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1}=\frac{a}{c} \quad {\mathrm{\widehat{OD}}}_0=\frac{{\hat{\pi}}_0}{1-{\hat{\pi}}_0}=\frac{b}{d} \end{gather}
発生リスク差
\begin{gather} \delta=\mathrm{RD}=\pi_1-\pi_0\\ \hat{\delta}=\mathrm{\widehat{RD}}={\hat{\pi}}_1-{\hat{\pi}}_0=\frac{a}{n_1}-\frac{b}{n_0} \end{gather}
発生リスク比
\begin{gather} \delta=\mathrm{RR}=\frac{\pi_1}{\pi_0}\\ \hat{\delta}=\mathrm{\widehat{RR}}=\frac{{\hat{\pi}}_1}{{\hat{\pi}}_0}=\frac{an_0}{bn_1} \end{gather}
発生オッズ比
\begin{gather} \delta=\mathrm{OR}=\frac{{\mathrm{OD}}_1}{{\mathrm{OD}}_0}=\frac{\pi_1}{1-\pi_1} \cdot \frac{1-\pi_0}{\pi_0}\\ \hat{\delta}=\mathrm{\widehat{OR}}=\frac{{\mathrm{\widehat{OD}}}_1}{{\mathrm{\widehat{OD}}}_0}=\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1} \cdot \frac{1-{\hat{\pi}}_0}{{\hat{\pi}}_0}=\frac{ad}{bc} \end{gather}
検定仮説
帰無仮説
\begin{gather} H_0:\pi_1=\pi_0 \end{gather}
対立仮説
①両側仮説 \begin{gather} H_1:\pi_1 \neq \pi_0 \end{gather} ②右側仮説 \begin{align} H_1:\pi_1 \gt \pi_0 \end{align} ③左側仮説 \begin{align} H_1:\pi_1 \lt \pi_0 \end{align}
人口寄与危険割合
母集団全体における曝露の割合と非曝露の割合を \begin{gather} \alpha_1 \quad \alpha_0=1-\alpha_1\\ {\hat{\alpha}}_1=\frac{n_1}{N} \end{gather} 全体の発症確率を \begin{gather} \pi_{\bullet }=\alpha_1\pi_1+\alpha_0\pi_0\\ {\hat{\pi}}_{\bullet }=\frac{m_1}{N} \end{gather} とすると、
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $\alpha_1\pi_1$ | $\alpha_1 \left(1-\pi_1\right)$ | $\alpha_1$ |
非曝露群 $(\bar{E})$ | $\alpha_0\pi_0$ | $\alpha_0 \left(1-\pi_0\right)$ | $\alpha_0$ |
$\pi_{\bullet }$ | $1-\pi_{\bullet }$ | $1$ |
母集団寄与危険割合は、 \begin{align} \mathrm{\mathrm{PAR}}&=\frac{\pi_{\bullet }-\pi_0}{\pi_{\bullet }}\\ &=\frac{\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}{1+\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}\\ &=\frac{\alpha_1 \left(\mathrm{\mathrm{RR}}-1\right)}{\alpha_1\mathrm{\mathrm{RR}+} \alpha_0}\\ &=\frac{n_1\pi_1-n_1\pi_0}{\pi_{\bullet }N} \end{align} 一致推定量は、 \begin{align} \mathrm{\widehat{PAR}}&=\frac{{\hat{\alpha}}_1 \left(\mathrm{\widehat{RR}}-1\right)}{1+{\hat{\alpha}}_1 \left(\mathrm{\widehat{RR}}-1\right)}\\ &=\frac{a-n_1{\hat{\pi}}_0}{m_1} \end{align}
参考文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.233
- 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック. 朝倉書店, 2018, p.503
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.20
0 件のコメント:
コメントを投稿