有病率・発生割合の信頼区間(検定の逆変換)

公開日: 更新日:

【2022年10月5週】 【A000】生物統計学 【A051】コホート研究 【A072】統計的推定

この記事をシェアする
  • B!
サムネイル画像

本稿では、横断研究やコホート研究における有病率・発生割合の信頼区間の導出を行っています。本稿における方法は、Wilson(1927)が提案した母比率の検定の逆変換にもとづく方法です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

【定理】有病率・発生割合の信頼区間(検定の逆変換)

【定理】
有病率・発生割合の信頼区間(検定の逆変換)
Confidence Interval for Prevalence or Incidence Proportion Based on Roots of a Quadratic Equation

マッチングなしのコホート研究における有病率・発生割合の非対称な $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{gather} 100 \left(1-\alpha\right)\%\ \mathrm{C.I.}= \left[\pi_L,\pi_U\right]\\ \pi_L=\frac{B-\sqrt C}{A} \quad \pi_U=\frac{B+\sqrt C}{A}\\ A=\frac{Z_{0.5\alpha}^2}{n}+1 \quad B=\frac{Z_{0.5\alpha}^2}{2n}+\hat{\pi} \quad C=\frac{Z_{0.5\alpha}^2}{4n} \left[\frac{Z_{0.5\alpha}^2}{n}+4\hat{\pi} \left(1-\hat{\pi}\right)\right] \end{gather} で与えられる。

導出:2次方程式の解として上下信頼限界を求める方法

導出

二項分布の正規近似により、標本比率は漸近的に、 \begin{align} p\xrightarrow[]{d}\mathrm{N} \left[\pi,\frac{\pi \left(1-\pi\right)}{n}\right] \end{align} 標本比率を標準化すると、 \begin{align} \frac{\sqrt n \left(p-\pi\right)}{\sqrt{\pi \left(1-\pi\right)}}=Z \sim \mathrm{N} \left(0,1\right) \end{align} このとき、母比率 $\pi$ の $100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{align} -Z_{0.5\alpha} \le \frac{\sqrt n \left(\hat{\pi}-\pi\right)}{\sqrt{\pi \left(1-\pi\right)}} \le Z_{0.5\alpha} \end{align} このとき、この不等式を $\pi$ について解いたときの値が上下の信頼限界となる。

略記のために $Z_{0.5\alpha}=z$ とおいて両辺を2乗すると、 \begin{gather} z^2=\frac{n \left(p-\pi\right)^2}{\pi \left(1-\pi\right)}\\ \pi^2-2p\pi+p^2-\frac{ \left(\pi-\pi^2\right)}{n}z^2=0\\ \left(\frac{z^2}{n}+1\right)\pi^2- \left(\frac{z^2}{n}+2p\right)\pi+p^2=0 \end{gather} 2次方程式の解の公式 $ax^2+bx+c=0\Rightarrow x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$ より、 \begin{align} \pi&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{ \left(\frac{z^2}{n}+2p\right)^2-4 \left(\frac{z^2}{n}+1\right)p^2}}{2 \left(\frac{z^2}{n}+1\right)}\\ &=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{4p^2+4p\frac{z^2}{n}+\frac{z^4}{n^2}-4p^2-4p^2\frac{z^2}{n}}}{2 \left(\frac{z^2}{n}+1\right)}\\ &=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{4p\frac{z^2}{n}+\frac{z^4}{n^2}-4p^2\frac{z^2}{n}}}{2 \left(\frac{z^2}{n}+1\right)}\\ &=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{\frac{z^2}{n} \left(4p+\frac{z^2}{n}-4p^2\right)}}{2 \left(\frac{z^2}{n}+1\right)}\\ &=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{\frac{z^2}{n} \left\{\frac{z^2}{n}+4p \left(1-p\right)\right\}}}{2 \left(\frac{z^2}{n}+1\right)}\\ &=\frac{ \left(\frac{z^2}{2n}+p\right)\pm\sqrt{\frac{z^2}{4n} \left\{\frac{z^2}{n}+4p \left(1-p\right)\right\}}}{\frac{z^2}{n}+1} \end{align} したがって、$100 \left(1-\alpha\right)\%$ 信頼区間は、 \begin{align} \frac{ \left(\frac{Z_{0.5\alpha}^2}{2n}+p\right)-\sqrt{\frac{Z_{0.5\alpha}^2}{4n} \left[\frac{Z_{0.5\alpha}^2}{n}+4p \left(1-p\right)\right]}}{\frac{Z_{0.5\alpha}^2}{n}+1} \le \pi \le \frac{ \left(\frac{Z_{0.5\alpha}^2}{2n}+p\right)+\sqrt{\frac{Z_{0.5\alpha}^2}{4n} \left[\frac{Z_{0.5\alpha}^2}{n}+4p \left(1-p\right)\right]}}{\frac{Z_{0.5\alpha}^2}{n}+1} \end{align}

通常、信頼区間を求める場合には、標準誤差 $\frac{\sqrt{\pi \left(1-\pi\right)}}{\sqrt n}$ の母数 $\pi$ をその一致推定量である $\hat{\pi}$ で置き換えるが、この方法の場合は、$\pi$ のまま計算し、$\pi$ に関する2次方程式の解として、上下の信頼限界を直接求める点に特徴がある。 $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.18
  • Wilson, E.B.. Probable Inference, the Law of Succession, and Statistical Inference. Journal of the American Statistical Association. 1927, 22(158), p.209-212, doi: 10.1080/01621459.1927.10502953

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ