本稿では、標本対数曝露オッズ比の漸近分布の導出を行っています。この漸近分布は、母集団曝露オッズ比の信頼区間を導出するうえでの基礎となります。特に、標本対数曝露オッズ比の漸近分散の公式は、Woolfの公式として非常に有名です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。
【定理】標本対数曝露オッズ比の漸近分布
【定理】
標本対数曝露オッズ比の漸近分布
Asymptotic Distribution of Sample Log Odds Ratios
マッチングなしのコホート研究における対数発症オッズ比と標本対数発症オッズ比を
\begin{gather}
\theta=\log{\mathrm{OR}}=\log{ \left[\frac{\pi_1}{1-\pi_1} \cdot \frac{1-\pi_0}{\pi_0}\right]}\\
\hat{\theta}=\log{\mathrm{\widehat{OR}}}=\log{ \left[\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1} \cdot \frac{1-{\hat{\pi}}_0}{{\hat{\pi}}_0}\right]}
\end{gather}
帰無仮説と対立仮説をそれぞれ
\begin{gather}
H_0:\pi_1=\pi_0 \left(=\pi\right) \quad H_1:\pi_1 \neq \pi_0
\end{gather}
とするとき、
標本対数発症オッズ比の漸近分布は、
〔1〕対立仮説
\begin{gather}
H_1:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi_1}{1-\pi_1}}-\log{\frac{\pi_0}{1-\pi_0}},\frac{1}{n_1\pi_1 \left(1-\pi_1\right)}+\frac{1}{n_0\pi_0 \left(1-\pi_0\right)}\right]
\end{gather}
漸近分散の一致推定量は、
\begin{gather}
{\hat{\sigma}}_1^2=\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}
\end{gather}
〔2〕帰無仮説 \begin{gather} H_0:\hat{\theta}\xrightarrow[]{d}\mathrm{N} \left[0,\frac{1}{\pi \left(1-\pi\right)} \left(\frac{1}{n_1}+\frac{1}{n_0}\right)\right] \end{gather} 漸近分散の一致推定量は、 \begin{gather} {\hat{\sigma}}_0^2=\frac{N^3}{m_1m_0n_1n_0} \end{gather}
そして、発症オッズ比と曝露オッズ比の同等性から、ここで導出した漸近分布や漸近分散は、 \begin{gather} \pi\Rightarrow\phi \end{gather} と置き換えて、そのまま適用することができる。
導出
二項分布の正規近似により、標本比率は漸近的に \begin{gather} p_1 \sim N \left[\pi_1,\frac{\pi_1 \left(1-\pi_1\right)}{n_1}\right]\\ p_0 \sim N \left[\pi_0,\frac{\pi_0 \left(1-\pi_0\right)}{n_0}\right] \end{gather} ここで、 \begin{gather} g \left(\pi_i\right)=\log{\frac{\pi_i}{1-\pi_i}}\\ g \left(p_i\right)=\log{\frac{p_i}{1-p_i}} \end{gather} と変数変換する。 デルタ法を用いて、$g \left(p_i\right)$ を期待値 $E \left(p_i\right)=\pi_i$ まわりでテイラー展開すると、$g \left(p_i\right)$ の1階微分は、 \begin{align} g^\prime \left(p_i\right)&=\frac{1-p_i}{p_i} \cdot \frac{d}{dp_i} \left(\frac{p_i}{1-p_i}\right)\\ &=\frac{1-p_i}{p_i} \cdot \frac{ \left(1-p_i\right)-1}{ \left(1-p_i\right)^2}\\ &=\frac{1}{p_i \left(1-p_i\right)} \end{align} よって、デルタ法における期待値と分散の公式より、 \begin{align} E \left\{g \left(p_i\right)\right\}&\cong E \left[g \left(\pi_i\right)\right]\\ &=\log{\frac{\pi_i}{1-\pi_i}}\\ \end{align} \begin{align} V \left[g \left(p_i\right)\right]&\cong \left\{g^\prime \left(\pi_i\right)\right\}^2V \left(p_i\right)\\ &=\frac{1}{\pi_i^2 \left(1-\pi_i\right)^2} \cdot \frac{\pi_i \left(1-\pi_i\right)}{n_i}\\ &=\frac{1}{n_i\pi_i \left(1-\pi_i\right)} \end{align} スラツキーの定理より、 \begin{align} \log{p_i}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi_i}{1-\pi_i}},\frac{1}{n_i\pi_i \left(1-\pi_i\right)}\right] \end{align} このとき、標本対数発症オッズ比は、 \begin{align} \log{\mathrm{\widehat{OR}}}=\log{\frac{p_1}{1-p_1}}-\log{\frac{p_0}{1-p_0}} \end{align} したがって、正規分布の再生性より、 \begin{align} \log{\mathrm{\widehat{OR}}}\xrightarrow[]{d}\mathrm{N} \left[\log{\frac{\pi_1}{1-\pi_1}}-\log{\frac{\pi_0}{1-\pi_0}},\frac{1}{n_1\pi_1 \left(1-\pi_1\right)}+\frac{1}{n_0\pi_0 \left(1-\pi_0\right)}\right] \end{align} 母比率を一致推定量である標本比率で置き換えると、期待値と分散の一致推定量は、 \begin{gather} \hat{E} \left[\log{\mathrm{\widehat{OR}}}\right]=\log{\frac{p_1}{1-p_1}}-\log{\frac{p_0}{1-p_0}}\\ \hat{V} \left(\log{\mathrm{\widehat{OR}}}\right)=\frac{1}{n_1p_0 \left(1-p_0\right)}+\frac{1}{n_0p_0 \left(1-p_0\right)} \end{gather} 分散についての式を部分分数分解すると、 \begin{align} {\hat{\sigma}}_1^2&=\frac{1}{n_1p_1}+\frac{1}{n_1 \left(1-p_1\right)}+\frac{1}{n_0p_0}+\frac{1}{n_0 \left(1-p_0\right)} \end{align} ここで、各セルの値について、 \begin{gather} a=n_1p_1\\ c=n_1 \left(1-p_1\right)\\ b=n_0p_0\\ d=n_0 \left(1-p_0\right) \end{gather} したがって、 \begin{align} {\hat{\sigma}}_1^2=\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d} \end{align}
〔2〕帰無仮説の下での漸近分布
$\pi_1=\pi_0=\pi$ を代入すると、帰無仮説のもとで、
\begin{align}
\log{\mathrm{\widehat{OR}}}\xrightarrow[]{d}\mathrm{N} \left[0,\frac{1}{\pi \left(1-\pi\right)} \left(\frac{1}{n_1}+\frac{1}{n_0}\right)\right]
\end{align}
共通の母比率 $\pi$ の一致推定量は、
\begin{align}
\hat{\pi}=\frac{m_1}{N}
\end{align}
これを用いて、母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、
\begin{align}
{\hat{\sigma}}_0^2&=\frac{1}{\hat{\pi} \left(1-\hat{\pi}\right)} \left(\frac{1}{n_1}+\frac{1}{n_0}\right)\\
&=\frac{N}{m_1} \cdot \frac{N}{m_0} \cdot \frac{N}{n_1n_0}\\
&=\frac{N^3}{m_1m_0n_1n_0}
\end{align}
そして、発症オッズ比と曝露オッズ比の同等性から、ここで導出した漸近分布や漸近分散は、 \begin{gather} \pi\Rightarrow\phi \end{gather} と置き換えて、そのまま適用することができる。 $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.27-28
- Woolf, B.. On estimating the relation between blood group and disease. Annals of human genetics. 1955, 19(4), p.251-253, doi: 10.1111/j.1469-1809.1955.tb01348.x
0 件のコメント:
コメントを投稿