本稿では、コホート研究における標本対数発症オッズの漸近分布の導出を行っています。標本対数オッズは標本発症リスクをロジット変換したものと言い換えることができますが、この漸近分布を導出することは、上限と下限が0から1の範囲に収まる発症リスクの信頼区間を求める際の基礎となります。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。
【定理】標本対数発症オッズの漸近分布
【定理】
標本対数発症オッズの漸近分布
Asymptotic Distribution of Sample Log Proportion Odds
マッチングなしのコホート研究における有病率・発生割合をロジット変換したもの(対数発症オッズ)を
\begin{gather}
\theta=g \left(\pi\right)=\log{\frac{\pi}{1-\pi}}\\
\hat{\theta}=g \left(p\right)=\log{\frac{\hat{\pi}}{1-\hat{\pi}}}
\end{gather}
帰無仮説と対立仮説をそれぞれ
\begin{gather}
H_0:\pi=\pi_0 \quad H_1:\pi \neq \pi_0
\end{gather}
とするとき、
標本対数発症オッズの漸近分布は、
〔1〕対立仮説
\begin{align}
H_1:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi}{1-\pi}},\frac{1}{n\pi \left(1-\pi\right)}\right]
\end{align}
標本対数オッズの漸近分散の一致推定量は、
\begin{align}
{\hat{\sigma}}_1^2=\frac{1}{n\hat{\pi} \left(1-\hat{\pi}\right)}
\end{align}
〔2〕帰無仮説 \begin{align} H_0:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi_0}{1-\pi_0}},\frac{1}{n\pi_0 \left(1-\pi_0\right)}\right] \end{align}
導出
〔1〕対立仮説の下での漸近分布
二項分布の正規近似により、標本比率は漸近的に、
\begin{align}
p\xrightarrow[]{d}\mathrm{N} \left[\pi,\frac{\pi \left(1-\pi\right)}{n}\right]
\end{align}
ここで、
\begin{gather}
\theta=g \left(\pi\right)=\log{\frac{\pi}{1-\pi}}\\
\hat{\theta}=g \left(p\right)=\log{\frac{p}{1-p}}
\end{gather}
と変数変換する。
デルタ法を用いて、$g \left(p\right)$ を期待値 $E \left(p\right)=\pi$ まわりでテイラー展開すると、$g \left(p\right)$ の1階微分は、
\begin{align}
g^\prime \left(p\right)&=\frac{1-p}{p} \cdot \frac{d}{dp} \left(\frac{p}{1-p}\right)\\
&=\frac{1-p}{p} \cdot \frac{ \left(1-p\right)- \left(-p\right)}{ \left(1-p\right)^2}\\
&=\frac{1}{p \left(1-p\right)}
\end{align}
よって、デルタ法における期待値と分散の公式より、
\begin{align}
E \left\{g \left(p\right)\right\}&\cong E \left[g \left(\pi\right)\right]\\
&=\log{\frac{\pi}{1-\pi}}\\
\end{align}
\begin{align}
V \left[g \left(p\right)\right]&\cong \left\{g^\prime \left(\pi\right)\right\}^2V \left(p\right)\\
&=\frac{1}{\pi^2 \left(1-\pi\right)^2} \cdot \frac{\pi \left(1-\pi\right)}{n}\\
&=\frac{1}{n\pi \left(1-\pi\right)}
\end{align}
したがって、スラツキーの定理より、
\begin{align}
\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi}{1-\pi}},\frac{1}{n\pi \left(1-\pi\right)}\right]
\end{align}
母比率を一致推定量である標本比率で置き換えると、標本比率の分散の一致推定量は、
\begin{gather}
{\hat{\sigma}}_1^2=\frac{\hat{\pi} \left(1-\hat{\pi}\right)}{n}
\end{gather}
〔2〕帰無仮説の下での漸近分布
$\pi=\pi_0$ を代入すると、帰無仮説のもとで、
\begin{align}
\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi_0}{1-\pi_0}},\frac{1}{n\pi_0 \left(1-\pi_0\right)}\right]
\end{align}
$\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.16-18
0 件のコメント:
コメントを投稿