標本対数発症リスク比の漸近分布

公開日: 更新日:

【2022年10月4週】 【A000】生物統計学 【A051】コホート研究 【A071】標本分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、標本対数発症リスク比の漸近分布の導出を行っています。この漸近分布は、母集団発症リスク比の信頼区間を導出するうえでの基礎となります。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。

【定理】標本対数発症リスク比の漸近分布

【定理】
標本対数発症リスク比の漸近分布
Asymptotic Distribution of Sample Risk Ratios

マッチングなしのコホート研究における対数発症リスク比と標本対数発症リスク比を \begin{gather} \theta=\log{\mathrm{RR}}=\log{\frac{\pi_1}{\pi_0}}\\ \hat{\theta}=\log{\mathrm{\widehat{RR}}}=\log{\frac{{\hat{\pi}}_1}{{\hat{\pi}}_0}} \end{gather} 帰無仮説と対立仮説をそれぞれ \begin{gather} H_0:\pi_1=\pi_0 \left(=\pi\right) \quad H_1:\pi_1 \neq \pi_0 \end{gather} とするとき、 標本対数発症リスク比の漸近分布は、
〔1〕対立仮説 \begin{gather} H_1:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\pi_1}-\log{\pi_0},\frac{1-\pi_1}{n_1\pi_1}+\frac{1-\pi_0}{n_0\pi_0}\right] \end{gather} 漸近分散の一致推定量は、 \begin{gather} {\hat{\sigma}}_1^2=\frac{1}{a}-\frac{1}{n_1}+\frac{1}{b}-\frac{1}{n_0} \end{gather}

〔2〕帰無仮説 \begin{gather} H_0:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[0,\frac{1-\pi}{\pi} \left(\frac{1}{n_1}+\frac{1}{n_0}\right)\right] \end{gather} 漸近分散の一致推定量は、 \begin{gather} {\hat{\sigma}}_0^2=\frac{m_0}{m_1} \left(\frac{1}{n_1}+\frac{1}{n_0}\right) \end{gather}

導出

導出

二項分布の正規近似により、標本比率は漸近的に \begin{gather} p_1 \sim \mathrm{N} \left[\pi_1,\frac{\pi_1 \left(1-\pi_1\right)}{n_1}\right]\\ p_0 \sim \mathrm{N} \left[\pi_0,\frac{\pi_0 \left(1-\pi_0\right)}{n_0}\right] \end{gather} ここで、 \begin{gather} g \left(\pi_i\right)=\log{\pi_i}\\ g \left(p_i\right)=\log{p_i} \end{gather} と変数変換する。 デルタ法を用いて、$g \left(p_i\right)$ を期待値 $E \left(p_i\right)=\pi_i$ まわりでテイラー展開すると、$g \left(p_i\right)$ の1階微分は、 \begin{align} g^\prime \left(p_i\right)=\frac{1}{p_i} \end{align} よって、デルタ法における期待値と分散の公式より、 \begin{align} E \left\{g \left(p_i\right)\right\}&\cong E \left[g \left(\pi_i\right)\right]\\ &=\log{\pi_i}\\ \end{align} \begin{align} V \left[g \left(p_i\right)\right]&\cong \left\{g^\prime \left(\pi_i\right)\right\}^2V \left(p_i\right)\\ &=\frac{1}{\pi_i^2} \cdot \frac{\pi_i \left(1-\pi_i\right)}{n_i}\\ &=\frac{1-\pi_i}{n_i\pi_i} \end{align} スラツキーの定理より、 \begin{align} \log{p_i}\xrightarrow[]{d}\mathrm{N} \left[\log{\pi_i},\frac{1-\pi_i}{n_i\pi_i}\right] \end{align} このとき、標本対数発症リスク比は、 \begin{align} \log{\mathrm{\widehat{RR}}}=\log{\frac{p_1}{p_0}}=\log{p_1}-\log{p_0} \end{align} したがって、正規分布の再生性より、 \begin{align} \log{\mathrm{\widehat{RR}}}\xrightarrow[]{d}\mathrm{N} \left[\log{\pi_1}-\log{\pi_0},\frac{1-\pi_1}{n_1\pi_1}+\frac{1-\pi_0}{n_0\pi_0}\right] \end{align} 母比率を一致推定量である標本比率で置き換えると、期待値と分散の一致推定量は、 \begin{gather} \hat{E} \left[\log{\mathrm{\widehat{RR}}}\right]=\log{p_1}-\log{p_2}\\ \hat{V} \left(\log{\mathrm{\widehat{RR}}}\right)=\frac{1-p_1}{n_1p_1}+\frac{1-p_0}{n_0p_0} \end{gather} 分散についてさらに式を整理すると、$a=n_1p_1,b=n_2p_2$ より、 \begin{align} {\hat{\sigma}}_1^2&=\frac{1-p_1}{a}+\frac{1-p_0}{b}\\ &=\frac{1}{a}-\frac{p_1}{a}+\frac{1}{b}-\frac{p_0}{b}\\ &=\frac{1}{a}-\frac{1}{n_1}+\frac{1}{b}-\frac{1}{n_0} \end{align}

〔2〕帰無仮説の下での漸近分布
$\pi_1=\pi_0=\pi$ を代入すると、帰無仮説のもとで、 \begin{align} \log{\mathrm{\widehat{RR}}}\xrightarrow[]{d}\mathrm{N} \left[0,\frac{1-\pi}{\pi} \left(\frac{1}{n_1}+\frac{1}{n_0}\right)\right] \end{align} 共通の母比率 $\pi$ の一致推定量は、 \begin{align} \hat{\pi}=\frac{a+b}{n_1+n_0}=\frac{m_1}{N} \end{align} これを用いて、母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、 \begin{align} {\hat{\sigma}}_0^2&=\frac{1-\hat{\pi}}{\hat{\pi}} \cdot \frac{N}{n_1n_0}\\ &=\frac{N}{m_1} \cdot \frac{m_0}{N} \cdot \frac{N}{n_1n_0}\\ &=\frac{m_0}{m_1} \cdot \frac{N}{n_1n_0} \end{align} $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.25-26

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ