本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題2.2」の自作解答例です。検定の逆変換にもとづく母比率の信頼区間に関する問題です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。
- 上述の参考書では、標準正規分布の上側 $100\alpha\%$ 点を $Z_{1-\alpha}$ と表記していますが、本サイトでは、$Z_\alpha$ としています。そのため、参考書に載っている式の形式と異なる部分があります。
- 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
- この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。
問題2.2
二項分布の正規近似により、標本成功確率は漸近的に、
\begin{align}
p\xrightarrow[]{d}\mathrm{N} \left[\pi,\frac{\pi \left(1-\pi\right)}{n}\right]
\end{align}
標本成功確率を標準化すると、
\begin{align}
\frac{\sqrt n \left(p-\pi\right)}{\sqrt{\pi \left(1-\pi\right)}}=Z \sim \mathrm{N} \left(0,1\right)
\end{align}
このとき、母数 $\pi$ の $100 \left(1-\alpha\right)\%$ 信頼区間は、
\begin{align}
-Z_{0.5\alpha} \le \frac{\sqrt n \left(p-\pi\right)}{\sqrt{\pi \left(1-\pi\right)}} \le Z_{0.5\alpha}
\end{align}
このとき、この不等式を $\pi$ について解いたときの値が上下の信頼限界となる。
略記のために $Z_{0.5\alpha}=z$ とおいて両辺を2乗すると、
\begin{gather}
z^2=\frac{n \left(p-\pi\right)^2}{\pi \left(1-\pi\right)}\\
\pi^2-2p\pi+p^2-\frac{ \left(\pi-\pi^2\right)}{n}z^2=0\\
\left(\frac{z^2}{n}+1\right)\pi^2- \left(\frac{z^2}{n}+2p\right)\pi+p^2=0
\end{gather}
2次方程式の解の公式 $ax^2+bx+c=0\Rightarrow x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$ より、
\begin{align}
\pi&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{ \left(\frac{z^2}{n}+2p\right)^2-4 \left(\frac{z^2}{n}+1\right)p^2}}{2 \left(\frac{z^2}{n}+1\right)}\\
&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{4p^2+4p\frac{z^2}{n}+\frac{z^4}{n^2}-4p^2-4p^2\frac{z^2}{n}}}{2 \left(\frac{z^2}{n}+1\right)}\\
&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{4p\frac{z^2}{n}+\frac{z^4}{n^2}-4p^2\frac{z^2}{n}}}{2 \left(\frac{z^2}{n}+1\right)}\\
&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{\frac{z^2}{n} \left(4p+\frac{z^2}{n}-4p^2\right)}}{2 \left(\frac{z^2}{n}+1\right)}\\
&=\frac{ \left(\frac{z^2}{n}+2p\right)\pm\sqrt{\frac{z^2}{n} \left\{\frac{z^2}{n}+4p \left(1-p\right)\right\}}}{2 \left(\frac{z^2}{n}+1\right)}\\
&=\frac{ \left(\frac{z^2}{2n}+p\right)\pm\sqrt{\frac{z^2}{4n} \left\{\frac{z^2}{n}+4p \left(1-p\right)\right\}}}{\frac{z^2}{n}+1}
\end{align}
したがって、$100 \left(1-\alpha\right)\%$ 信頼区間は、
\begin{align}
\frac{ \left(\frac{Z_{0.5\alpha}^2}{2n}+p\right)-\sqrt{\frac{Z_{0.5\alpha}^2}{4n} \left[\frac{Z_{0.5\alpha}^2}{n}+4p \left(1-p\right)\right]}}{\frac{Z_{0.5\alpha}^2}{n}+1} \le \pi \le \frac{ \left(\frac{Z_{0.5\alpha}^2}{2n}+p\right)+\sqrt{\frac{Z_{0.5\alpha}^2}{4n} \left[\frac{Z_{0.5\alpha}^2}{n}+4p \left(1-p\right)\right]}}{\frac{Z_{0.5\alpha}^2}{n}+1}
\end{align}
$\blacksquare$
通常、信頼区間を求める場合には、標準誤差 $\frac{\sqrt{\pi \left(1-\pi\right)}}{\sqrt n}$ の母数 $\pi$ をその一致推定量である $p$ で置き換えるが、この方法の場合は、$\pi$ のまま計算し、$\pi$ に関する2次方程式の解として、上下の信頼限界を直接求める点に特徴がある。
サンプルサイズとイベント数が問題文で与えられた条件のとき、 \begin{gather} p=\frac{2}{46}=0.04 \end{gather} $\pi$ に対する信頼限界は、 \begin{gather} {\hat{\theta}}_L=\frac{ \left(\frac{{1.96}^2}{2 \cdot 46}+0.04\right)-\sqrt{\frac{{1.96}^2}{4 \cdot 46} \left[\frac{{1.96}^2}{46}+4 \cdot 0.04 \left(1-0.04\right)\right]}}{\frac{{1.96}^2}{46}+1}=0.012005\\ {\hat{\theta}}_U=\frac{ \left(\frac{{1.96}^2}{2 \cdot 46}+0.04\right)+\sqrt{\frac{{1.96}^2}{4 \cdot 46} \left[\frac{{1.96}^2}{46}+4 \cdot 0.04 \left(1-0.04\right)\right]}}{\frac{{1.96}^2}{46}+1}=0.14533 \end{gather} $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.18-19, p.80
- Wilson, E.B.. Probable Inference, the Law of Succession, and Statistical Inference. Journal of the American Statistical Association. 1927;22(158):209-212, doi: https://doi.org/10.2307/2276774
0 件のコメント:
コメントを投稿