平均発生率の差に関する優越性試験のサンプルサイズ設計の公式

公開日: 更新日:

【2022年11月3週】 【A000】生物統計学 【A051】コホート研究 【A074】サンプルサイズの設計

この記事をシェアする
  • B!
サムネイル画像

本稿では、平均発生率を指標とするコホート研究について、平均発生率の差に関する優越性試験のサンプルサイズ設計の公式を導出しています。基本的には各群に必要な観察人・時を求めることになりますが、曝露時間の分布を仮定すると、必要人数を求めることができます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。

【公式】平均発生率の差に関する優越性試験のサンプルサイズ設計の公式

【公式】
平均発生率の差に関する優越性試験のサンプルサイズ設計の公式
Sample Size Determination for Incidence Rate Difference

平均発生率を指標とするマッチングなしのコホート研究について、
各群の観察リスク人・時を \begin{gather} T_1=T_0=\tau \end{gather} 帰無仮説と対立仮説を \begin{gather} H_0:\lambda_1-\lambda_0=0 \quad H_1:\lambda_1-\lambda_0=\Delta \end{gather} とする。

曝露群と非曝露群の平均発生率 \begin{gather} \lambda_1 \quad \lambda_0 \end{gather} を具体的定数として与え、 有意水準と検出力をそれぞれ、 \begin{align} \alpha \quad 1-\beta \end{align} とするとき、 \begin{gather} \tau= \left[\frac{Z_\alpha \cdot \sqrt{2\lambda}-Z_{1-\beta} \cdot \sqrt{\lambda_1+\lambda_0}}{\lambda_1-\lambda_0}\right]^2\\ \lambda=\frac{\lambda_1+\lambda_0}{2} \end{gather}

特に、曝露時間の分布 $ \left\{t_i\right\}, \left\{t_j\right\}$ は平均を \begin{gather} \eta_t \end{gather} とし、2つのグループ内の被験者間で同じであると仮定する。 すなわち、 \begin{gather} E \left(T_1\right)=E \left(T_0\right)=N\eta_t \end{gather} とすると、 \begin{align} N= \left[\frac{Z_\alpha \cdot \sqrt{2\lambda}-Z_{1-\beta} \cdot \sqrt{\lambda_1+\lambda_0}}{\sqrt{\eta_t} \left(\lambda_1-\lambda_0\right)}\right]^2 \end{align}

導出

導出

帰無仮説をいいかえると、 \begin{gather} H_0:\lambda_1=\lambda_0=\lambda \end{gather}

標本平均発生率の差の漸近分布は、対立仮説の下で \begin{align} \hat{\delta}\xrightarrow[]{d}\mathrm{N} \left[\Delta,\frac{\lambda_1+\lambda_0}{\tau}\right] \end{align} 帰無仮説の下で \begin{align} \hat{\delta}\xrightarrow[]{d}\mathrm{N} \left[0,\frac{2\lambda}{\tau}\right] \end{align} 帰無仮説の下での共通の平均発生率の推定値は、 \begin{align} \lambda=\frac{\lambda_1+\lambda_0}{2} \end{align} したがって、検定統計量の分散について、 \begin{gather} \frac{\phi_0^2}{\tau}=\frac{2\lambda}{\tau}\\ \phi_0^2=2\lambda\\ \phi_0=\sqrt{2\lambda} \end{gather} \begin{gather} \frac{\phi_1^2}{\tau}=\frac{\lambda_1+\lambda_0}{\tau}\\ \phi_1^2=\lambda_1+\lambda_0\\ \phi_1=\sqrt{\lambda_1+\lambda_0} \end{gather} これをサンプルサイズの設計公式に代入すると、 \begin{align} \tau= \left[\frac{Z_\alpha \cdot \sqrt{2\lambda}-Z_{1-\beta} \cdot \sqrt{\lambda_1+\lambda_0}}{\lambda_1-\lambda_0}\right]^2 \end{align}

特に、曝露時間の分布 $ \left\{t_i\right\}, \left\{t_j\right\}$ は平均を \begin{gather} \eta_t \end{gather} とし、 2つのグループ内の被験者間で同じであると仮定する。このとき、 \begin{gather} E \left(T_1\right)=E \left(T_0\right)=N\eta_t \end{gather} となる。 この場合、 \begin{gather} \frac{\phi_0^2}{N}=\frac{2\lambda}{N\eta_t}\\ \phi_0^2=\frac{2\lambda}{\eta_t}\\ \phi_0=\frac{\sqrt{2\lambda}}{\sqrt{\eta_t}} \end{gather} \begin{gather} \frac{\phi_1^2}{N}=\frac{\lambda_1+\lambda_0}{N\eta_t}\\ \phi_1^2=\frac{\lambda_1+\lambda_0}{\eta_t}\\ \phi_1=\frac{\sqrt{\lambda_1+\lambda_0}}{\sqrt{\eta_t}} \end{gather} これをサンプルサイズの設計公式に代入すると、 \begin{align} N= \left[\frac{Z_\alpha \cdot \sqrt{2\lambda}-Z_{1-\beta} \cdot \sqrt{\lambda_1+\lambda_0}}{\sqrt{\eta_t} \left(\lambda_1-\lambda_0\right)}\right]^2 \end{align} $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.446-447, p.455

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ