本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題2.7」の自作解答例です。Thomas-Gartの方法にもとづく母比率の信頼区間に関する問題です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
- この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。
問題2.7.1:オッズ比の期待値
二項分布の期待値の公式より、各群の発症者数 $a,b$ の期待値は、 \begin{gather} E \left(a\right)=n_1\pi_1\\ E \left(b\right)=n_2\pi_2\tag{1} \end{gather} 周辺度数 $n_1,n_2,m_1,m_2$ が固定されているとき、 \begin{gather} b=m_1-a \end{gather} 両辺の期待値を取ると、 \begin{gather} E \left(b\right)=m_1-n_1\pi_1\tag{2} \end{gather} 式 $(1),(2)$ を $\pi_2$ について解くと、 \begin{gather} n_2\pi_2=m_1-n_1\pi_1\\ \pi_2=\frac{m_1-n_1\pi_1}{n_2}\tag{3} \end{gather} オッズ比の定義式 $\varphi=\frac{\pi_1}{1-\pi_1} \cdot \frac{1-\pi_2}{\pi_2}$ より、 \begin{align} \widetilde{\varphi}&=\frac{\pi_1}{1-\pi_1} \cdot \frac{n_2}{m_1-n_1\pi_1} \cdot \frac{n_2- \left(m_1-n_1\pi_1\right)}{n_2}\\ &=\frac{\pi_1 \left(n_2-m_1+n_1\pi_1\right)}{ \left(1-\pi_1\right) \left(m_1-n_1\pi_1\right)} \end{align} $\blacksquare$
問題2.7.2:2次方程式の導出
先ほどの式を $\pi_1$ について整理すると、 \begin{gather} \widetilde{\varphi} \left(1-\pi_1\right) \left(m_1-n_1\pi_1\right)=\pi_1 \left(n_2-m_1+n_1\pi_1\right)\\ \widetilde{\varphi}m_1-\widetilde{\varphi}n_1\pi_1-\widetilde{\varphi}m_1\pi_1+\widetilde{\varphi}n_1\pi_1^2=n_1\pi_1^2+n_2\pi_1-m_1\pi_1\\ n_1\pi_1^2-\widetilde{\varphi}n_1\pi_1^2+\widetilde{\varphi}n_1\pi_1+\widetilde{\varphi}m_1\pi_1+n_2\pi_1-m_1\pi_1+\widetilde{\varphi}m_1=0\\ \left[n_1 \left(1-\widetilde{\varphi}\right)\right]\pi_1^2+ \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]\pi_1-\widetilde{\varphi}m_1=0\\ \left[n_1 \left(\widetilde{\varphi}-1\right)\right]\pi_1^2- \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]\pi_1+\widetilde{\varphi}m_1=0 \end{gather} $\blacksquare$
問題2.7.3:群1の発症確率
2次方程式の解の公式 $ax^2+bx+c=0\Rightarrow x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$ より、 \begin{align} \pi_1=\frac{ \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]\pm\sqrt{ \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]^2-4\widetilde{\varphi}m_1 \left[n_1 \left(\widetilde{\varphi}-1\right)\right]}}{2 \left[n_1 \left(\widetilde{\varphi}-1\right)\right]} \end{align} したがって、 \begin{align} C= \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]-\sqrt{ \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]^2-4\widetilde{\varphi}m_1 \left[n_1 \left(\widetilde{\varphi}-1\right)\right]} \end{align} とすると、 \begin{align} \pi_1=\frac{C}{2 \left[n_1 \left(\widetilde{\varphi}-1\right)\right]} \end{align} $\blacksquare$
上記の解答の中で、大きい方の値 \begin{align} \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]+\sqrt{ \left[\widetilde{\varphi} \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]^2-4\widetilde{\varphi}m_1 \left[n_1 \left(\widetilde{\varphi}-1\right)\right]} \end{align} が除外される理由については、よく分かりません。問題2.7.4:群2の発症確率
式 $(3)$ を再掲すると、
\begin{gather}
\pi_2=\frac{m_1-n_1\pi_1}{n_2}
\end{gather}
オッズ比の上下信頼限界をそれぞれ ${\widetilde{\varphi}}_L,{\widetilde{\varphi}}_U$ とすると、
\begin{gather}
{\hat{\pi}}_{1L}=\frac{ \left[{\widetilde{\varphi}}_L \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]-\sqrt{ \left[{\widetilde{\varphi}}_L \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]^2-4{\widetilde{\varphi}}_Lm_1 \left[n_1 \left({\widetilde{\varphi}}_L-1\right)\right]}}{2 \left[n_1 \left({\widetilde{\varphi}}_L-1\right)\right]}\\
{\hat{\pi}}_{2L}=\frac{m_1-n_1{\hat{\pi}}_{1L}}{n_2}\\
{\hat{\pi}}_{1U}=\frac{ \left[{\widetilde{\varphi}}_U \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]-\sqrt{ \left[{\widetilde{\varphi}}_U \left(n_1+m_1\right)+ \left(n_2-m_1\right)\right]^2-4{\widetilde{\varphi}}_Um_1 \left[n_1 \left({\widetilde{\varphi}}_U-1\right)\right]}}{2 \left[n_1 \left({\widetilde{\varphi}}_U-1\right)\right]}\\
{\hat{\pi}}_{2U}=\frac{m_1-n_1{\hat{\pi}}_{1U}}{n_2}
\end{gather}
これより、
(i)リスク差の正確な上下信頼限界
\begin{align}
{\mathrm{\widehat{RD}}}_L={\hat{\pi}}_{1L}-{\hat{\pi}}_{2L} \quad {\mathrm{\widehat{RD}}}_U={\hat{\pi}}_{1U}-{\hat{\pi}}_{2U}
\end{align}
(ii)リスク比の正確な上下信頼限界
\begin{align}
{\mathrm{\widehat{RR}}}_L=\frac{{\hat{\pi}}_{1L}}{{\hat{\pi}}_{2L}} \quad {\mathrm{\widehat{RR}}}_U=\frac{{\hat{\pi}}_{1U}}{{\hat{\pi}}_{2U}}
\end{align}
$\blacksquare$
問題2.7.5:例題
得られた公式に各値を代入すると、下側限界は、 \begin{gather} {\hat{\pi}}_{1L}&=\frac{ \left[0.0127 \left(19+15\right)+ \left(10-15\right)\right]-\sqrt{ \left[0.0127 \left(19+15\right)+ \left(10-15\right)\right]^2-4 \cdot 0.0127 \cdot 15 \left[19 \left(0.0127-1\right)\right]}}{2 \left[19 \left(0.0127-1\right)\right]}\\ &=0.2798 \end{gather} \begin{gather} {\hat{\pi}}_{2L}&=\frac{15-19 \cdot 0.2798}{10}\\ &=0.9683 \end{gather}
したがって、 \begin{align} {\mathrm{\widehat{RD}}}_L=0.2798-0.9683=-0.6885 \end{align} \begin{align} {\mathrm{\widehat{RR}}}_L=\frac{0.2798}{0.9683}=0.2890 \end{align}
同様に、上側限界は、 \begin{align} {\hat{\pi}}_{1U}&=\frac{ \left[1.0952 \left(19+15\right)+ \left(10-15\right)\right]-\sqrt{ \left[1.0952 \left(19+15\right)+ \left(10-15\right)\right]^2-4 \cdot 1.0952 \cdot 15 \left[19 \left(1.0952-1\right)\right]}}{2 \left[19 \left(1.0952-1\right)\right]}\\ &=0.5251 \end{align} \begin{gather} {\hat{\pi}}_{2L}&=\frac{15-19 \cdot 0.5251}{10}\\ &=0.5024 \end{gather}
したがって、 \begin{align} {\mathrm{\widehat{RD}}}_L=0.5251-0.5024=0.0227 \end{align} \begin{align} {\mathrm{\widehat{RR}}}_L=\frac{0.5251}{0.5024}=1.0452 \end{align}
まとめると、 \begin{gather} \mathrm{\widehat{RD}}: \left[-0.6885,0.0227\right]\\ \mathrm{\widehat{RR}}: \left[0.2890,1.0452\right] \end{gather}
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.83
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.33-34
- Thomas, D.G. & Gart, J.J.. A Table of Exact Confidence Limits for Differences and Ratios of Two Proportions and Their Odds Ratios. Journal of the American Statistical Association. 1977;72(357):73-76, doi: https://doi.org/10.2307/2286908
0 件のコメント:
コメントを投稿