本稿では、コホート研究の研究デザインのうち、①平均発生率を曝露効果の指標とする、②層化ありのデザイン・パターンについて、その分割表の形式、統計モデル、曝露効果の指標の定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
周辺解析
分割表の形式
研究期間を \begin{gather} S \left[\mathrm{Time}\right] \end{gather} 曝露群と非曝露群の観察対象人数をそれぞれ、 \begin{gather} n_{1\bullet } \quad n_{0\bullet }\\ N_{\bullet }=n_{1\bullet }+n_{0\bullet } \end{gather} 研究期間内にそれぞれの集団内で発生したイベント数を \begin{gather} a_{\bullet } \left(=d_{1\bullet }\right) \quad b_{\bullet } \left(=d_{0\bullet }\right) \end{gather} 曝露群の $i$ 番目の対象者がリスクに曝露されていた時間(リスク人・時)を \begin{gather} t_i \quad i=1,2, \cdots ,n_{1\bullet } \end{gather} 非曝露群の $j$ 番目の対象者がリスクに曝露されていた時間(リスク人・時)を \begin{gather} t_j \quad j=1,2, \cdots ,n_{0\bullet } \end{gather} 曝露群と非曝露群の総リスク人・時をそれぞれ、 \begin{gather} T_{1\bullet }=\sum_{i=1}^{n_{1\bullet }}t_i \quad T_{0\bullet }=\sum_{j=1}^{n_{0\bullet }}t_j\\ \end{gather} 両群を合わせた全体としての総リスク人・時を \begin{gather} T_{\bullet }=T_{1\bullet }+T_{0\bullet } \end{gather} 両群を合わせた全体としての総イベント発生数を \begin{gather} M_{\bullet }=a_{\bullet }+b_{\bullet } \end{gather} とする。
発生数 $ \left(D\right)$ | リスク人・時 | |
---|---|---|
曝露群 $ \left(E\right)$ | $a_{\bullet }$ | $T_{1\bullet }$ |
非曝露群 $(\bar{E})$ | $b_{\bullet }$ | $T_{0\bullet }$ |
合計 | $M_{\bullet }$ | $T_{\bullet }$ |
統計モデル
曝露群と非曝露群の観察人・時 \begin{gather} T_{1\bullet } \quad T_{0\bullet } \end{gather} が固定されているという条件の下で 各群のイベント発生数 $a_{\bullet },b_{\bullet }$ が互いに独立に、パラメータ(単位時間あたりの平均発生回数)がそれぞれ \begin{align} \lambda_{1\bullet } \quad \lambda_{0\bullet } \end{align} である ポアソン分布 \begin{align} a_{\bullet } \left(=d_{1\bullet }\right) \sim \mathrm{Po} \left(\lambda_{1\bullet }\right) \quad b_{\bullet } \left(=d_{0\bullet }\right) \sim \mathrm{Po} \left(\lambda_{0\bullet }\right) \end{align} に従うとする。 ただし、各群のイベント発生率は研究期間を通じて一定であるとする。
曝露効果の指標
平均発生率
\begin{gather} {\mathrm{IR}}_{1\bullet }=\lambda_{1\bullet } \quad {\mathrm{IR}}_{0\bullet }=\lambda_{0\bullet }\\ {\mathrm{\widehat{IR}}}_{1\bullet }={\hat{\lambda}}_{1\bullet }=\frac{a_{\bullet }}{T_{1\bullet }} \quad {\mathrm{\widehat{IR}}}_{0\bullet }={\hat{\lambda}}_{0\bullet }=\frac{b_{\bullet }}{T_{0\bullet }} \end{gather}
平均発生率差
\begin{gather} \delta={\mathrm{IRD}}_{1\bullet }=\lambda_{1\bullet }-\lambda_{0\bullet }\\ \hat{\delta}={\mathrm{\widehat{IRD}}}_{1\bullet }={\hat{\lambda}}_{1\bullet }-{\hat{\lambda}}_{0\bullet }=\frac{a_{\bullet }}{T_{1\bullet }}-\frac{b_{\bullet }}{T_{0\bullet }} \end{gather}
平均発生率比
\begin{gather} \delta={\mathrm{IRR}}_{1\bullet }=\frac{\lambda_{1\bullet }}{\lambda_{0\bullet }}\\ \hat{\delta}={\mathrm{\widehat{IRR}}}_{1\bullet }=\frac{{\hat{\lambda}}_{1\bullet }}{{\hat{\lambda}}_{0\bullet }}=\frac{a_{\bullet }T_{0\bullet }}{b_{\bullet }T_{1\bullet }} \end{gather}
寄与危険割合
\begin{gather} {\mathrm{ARP}}_{\bullet }=\frac{\lambda_{1\bullet }-\lambda_{0\bullet }}{\lambda_{1\bullet }}\\ {\mathrm{\widehat{ARP}}}_{\bullet }=\frac{{\hat{\lambda}}_{1\bullet }-{\hat{\lambda}}_{0\bullet }}{{\hat{\lambda}}_{1\bullet }}=\frac{\frac{a_{\bullet }}{T_{1\bullet }}-\frac{b_{\bullet }}{T_{0\bullet }}}{\frac{a_{\bullet }}{T_{1\bullet }}} \end{gather}
交絡の調整
しかし、このような単純な周辺解析を行うと、交絡の影響により、誤った結論に陥る可能性がある。そのため、「対象者の限定」の原理にもとづいて交絡因子の影響を取り除くために、得られたデータを交絡因子の水準にもとづいて、互いに独立な $K$ 個の層に層化する。
層別解析
分割表の形式
第 $k$ 層における曝露群と非曝露群の観察対象人数をそれぞれ、 \begin{gather} n_{1k} \quad n_{0k}\\ N_k=n_{1k}+n_{0k} \end{gather} 研究期間内にそれぞれの集団内で発生したイベント数を \begin{gather} a_k \left(=d_{1k}\right) \quad b_k \left(=d_{0k}\right) \end{gather} 曝露群の $i$ 番目の対象者がリスクに曝露されていた時間(リスク人・時)を \begin{gather} t_i \quad i=1,2, \cdots ,n_{1k} \end{gather} 非曝露群の $j$ 番目の対象者がリスクに曝露されていた時間(リスク人・時)を \begin{gather} t_j \quad j=1,2, \cdots ,n_{0k} \end{gather} 曝露群と非曝露群の総リスク人・時をそれぞれ、 \begin{gather} T_{1k}=\sum_{i=1}^{n_{1k}}t_i \quad T_{0k}=\sum_{j=1}^{n_{0k}}t_j\\ \end{gather} 両群を合わせた全体としての総リスク人・時を \begin{gather} T_k=T_{1k}+T_{0k} \end{gather} 両群を合わせた全体としての総イベント発生数を \begin{gather} M_k=a_k+b_k \end{gather} とする。発生数 $ \left(D\right)$ | リスク人・時 | |
---|---|---|
曝露群 $ \left(E\right)$ | $a_k$ | $T_{1k}$ |
非曝露群 $(\bar{E})$ | $b_k$ | $T_{0k}$ |
合計 | $M_k$ | $T_k$ |
ただし、 \begin{gather} a_{\bullet }=\sum_{k=1}^{K}a_k \quad b_{\bullet }=\sum_{k=1}^{K}b_k\\ M_{\bullet }=\sum_{k=1}^{K}M_k\\ T_{1\bullet }=\sum_{k=1}^{K}T_{1k} \quad T_{0\bullet }=\sum_{k=1}^{K}T_{0k} \end{gather}
統計モデル
曝露群と非曝露群の観察人・時 \begin{gather} T_{1k} \quad T_{0k} \end{gather} が固定されているという条件の下で 各群のイベント発生数 $a_k,b_k$ が互いに独立に、パラメータ(単位時間あたりの平均発生回数)がそれぞれ \begin{align} \lambda_{1k} \quad \lambda_{0k} \end{align} である ポアソン分布 \begin{align} a_k \left(=d_{1k}\right) \sim \mathrm{Po} \left(\lambda_{1k}\right) \quad b_k \left(=d_{0k}\right) \sim \mathrm{Po} \left(\lambda_{0k}\right) \end{align} に従うとする。 ただし、各群のイベント発生率は研究期間を通じて一定であるとする。
曝露効果の指標
平均発生率
\begin{gather} {\mathrm{IR}}_{1k}=\lambda_{1k} \quad {\mathrm{IR}}_{0k}=\lambda_{0k}\\ {\mathrm{\widehat{IR}}}_{1k}={\hat{\lambda}}_{1k}=\frac{a_k}{T_{1k}} \quad {\mathrm{\widehat{IR}}}_{0k}={\hat{\lambda}}_{0k}=\frac{b_k}{T_{0k}} \end{gather}
平均発生率差
\begin{gather} \delta={\mathrm{IRD}}_{1k}=\lambda_{1k}-\lambda_{0k}\\ \hat{\delta}={\mathrm{\widehat{IRD}}}_{1k}={\hat{\lambda}}_{1k}-{\hat{\lambda}}_{0k}=\frac{a_k}{T_{1k}}-\frac{b_k}{T_{0k}} \end{gather}
平均発生率比
\begin{gather} \delta={\mathrm{IRR}}_{1\bullet }=\frac{\lambda_{1k}}{\lambda_{0k}}\\ \hat{\delta}={\mathrm{\widehat{IRR}}}_{1\bullet }=\frac{{\hat{\lambda}}_{1k}}{{\hat{\lambda}}_{0k}}=\frac{a_kT_{0k}}{b_kT_{1k}} \end{gather}
寄与危険割合
\begin{gather} {\mathrm{ARP}}_k=\frac{\lambda_{1k}-\lambda_{0k}}{\lambda_{1k}}\\ {\mathrm{\widehat{ARP}}}_k=\frac{{\hat{\lambda}}_{1k}-{\hat{\lambda}}_{0k}}{{\hat{\lambda}}_{1k}}=\frac{\frac{a_k}{T_{1k}}-\frac{b_k}{T_{0k}}}{\frac{a_k}{T_{1k}}} \end{gather}
検定仮説
帰無仮説
すべての $k=1,2, \cdots ,K$ に対し、 \begin{align} H_0:\lambda_{1k}=\lambda_{0k} \end{align}
対立仮説
すべての $k=1,2, \cdots ,K$ に対し、 \begin{align} H_1:\lambda_{1k} \neq \lambda_{0k} \end{align}
参考文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.256
0 件のコメント:
コメントを投稿