ジョン・ラチン(2020)『医薬データのための統計解析』 問題5.6 解答例

公開日: 更新日:

【2022年11月2週】 【A000】生物統計学 【A061】マッチング研究

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題5.6」の自作解答例です。多項分布にもとづくマクネマー検定統計量の導出に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題5.6.1:対立仮説における標本比率の差の分散

確率変数の差の分散の公式 $V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right)$ より、 \begin{align} V \left(p_{12}-p_{21}\right)&=V \left(p_{12}\right)+V \left(p_{21}\right)-2\mathrm{Cov} \left(p_{12},p_{21}\right)\\ &=\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}+\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}-2 \left(-\frac{\pi_{12}\pi_{11}}{N}\right)\\ &=\frac{\pi_{12}-\pi_{12}^2+\pi_{21}-\pi_{21}^2+2\pi_{12}\pi_{11}}{N}\\ &=\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N} \end{align} $\blacksquare$

問題5.6.2:帰無仮説における標本比率の差の分散

帰無仮説 $H_0:\pi_{12}=\pi_{21}=\pi$ における標本比率の差の分散は、 \begin{align} V \left(p_{12}-p_{21}\right)&=\frac{ \left(\pi+\pi\right)- \left(\pi-\pi\right)^2}{N}\\ &=\frac{2\pi}{N} \end{align} $\blacksquare$

問題5.6.3, 問題5.6.4:マクネマー検定統計量

標本比率の差の分散の一致推定量は、 \begin{align} \hat{V} \left(p_{12}-p_{21}\right)=\frac{p_{12}+p_{21}}{N} \end{align} これを標準化した値は、 \begin{align} \frac{\sqrt N \left(p_{12}-p_{21}\right)}{\sqrt{p_{12}+p_{21}}}=Z_M \sim \left(0,1\right) \end{align} また、 \begin{align} Z_M&=\frac{N}{N} \cdot \frac{\sqrt N \left(p_{12}-p_{21}\right)}{\sqrt{p_{12}+p_{21}}}\\ &=\frac{N \left(p_{12}-p_{21}\right)}{\sqrt{N \left(p_{12}+p_{21}\right)}} \end{align} $Np_{12}=f,Np_{21}=g$ より、 \begin{align} Z_M=\frac{f-g}{\sqrt{f+g}} \end{align} これを2乗した値は、 \begin{gather} \frac{ \left(f-g\right)^2}{f+g}=\chi_M^2 \sim \chi^2 \left(1\right) \end{gather} $\blacksquare$

問題5.6.5:対数条件付きオッズ比の漸近分散―四項分布にもとづく考え方

多項分布の周辺分布であることから、 \begin{align} e \sim \mathrm{B} \left(N,\pi_{11}\right)\\ f \sim \mathrm{B} \left(N,\pi_{12}\right) \end{align} 二項分布の正規近似により、標本比率は漸近的に \begin{gather} p_{12} \sim N \left[\pi_{12},\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}\right]\\ p_{21} \sim N \left[\pi_{21},\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}\right] \end{gather} 標本比率ベクトルを \begin{align} \boldsymbol{p}= \left(\begin{matrix}p_{12}\\p_{21}\\\end{matrix}\right) \end{align} 期待値ベクトルを \begin{align} \boldsymbol{\pi}= \left(\begin{matrix}\pi_{12}\\\pi_{21}\\\end{matrix}\right) \end{align} 分散・共分散行列を \begin{align} \boldsymbol{\Omega}= \left[\begin{matrix}\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}&-\frac{\pi_{12}\pi_{21}}{N}\\-\frac{\pi_{12}\pi_{21}}{N}&\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}\\\end{matrix}\right] \end{align} として、 \begin{gather} G \left(\boldsymbol{\pi}\right)=\theta=\log{\frac{\pi_{12}}{\pi_{21}}}\\ G \left(\boldsymbol{p}\right)=\hat{\theta}=\log{\frac{p_{12}}{p_{21}}} \end{gather} と変数変換する。 多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\pi}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\pi}\right)}{\partial\pi_1}\\\frac{G \left(\boldsymbol{\pi}\right)}{\partial\pi_2}\\\end{matrix}\right)= \left[\begin{matrix}\frac{1}{\pi_{12}}\\-\frac{1}{\pi_{21}}\\\end{matrix}\right] \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[G \left(\boldsymbol{p}\right)\right]\cong G \left(\boldsymbol{\pi}\right)=\log{\frac{\pi_{12}}{\pi_{21}}} \end{align} \begin{align} V \left[G \left(\boldsymbol{p}\right)\right]&= \left[\begin{matrix}\frac{1}{\pi_{12}}&-\frac{1}{\pi_{21}}\\\end{matrix}\right] \left[\begin{matrix}\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}&-\frac{\pi_{12}\pi_{21}}{N}\\-\frac{\pi_{21}\pi_{12}}{N}&\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}\\\end{matrix}\right] \left[\begin{matrix}\frac{1}{\pi_{12}}\\-\frac{1}{\pi_{21}}\\\end{matrix}\right]\\ &= \left[\begin{matrix}\frac{1}{\pi_{12}}&-\frac{1}{\pi_{21}}\\\end{matrix}\right] \left[\begin{matrix}\frac{1}{N}\\-\frac{1}{N}\\\end{matrix}\right]\\ &=\frac{1}{N\pi_{12}}+\frac{1}{N\pi_{21}} \end{align} 母比率 $\pi_i$ を一致推定量である標本比率 $p_i$ で置き換えると、漸近分散の一致推定量は、 \begin{align} \hat{V} \left[\hat{\theta}\right]=\frac{1}{Np_{12}}+\frac{1}{Np_{21}}=\frac{1}{f}+\frac{1}{g} \end{align} $\blacksquare$

問題5.6.6:対数母集団平均相対リスクの漸近分散―四項分布にもとづく考え方

多項分布の周辺分布であることから、 \begin{gather} e \sim \mathrm{B} \left(N,\pi_{11}\right)\\ f \sim \mathrm{B} \left(N,\pi_{12}\right)\\ g \sim \mathrm{B} \left(N,\pi_{21}\right)\\ e+f=n_{1\bullet } \sim \mathrm{B} \left(N,\pi_{1\bullet }\right)\\ e+g=n_{\bullet 1} \sim \mathrm{B} \left(N,\pi_{\bullet 1}\right) \end{gather} 二項分布の正規近似により、標本比率は漸近的に \begin{gather} p_{11} \sim \mathrm{N} \left[\pi_{11},\frac{\pi_{11} \left(1-\pi_{11}\right)}{N}\right]\\ p_{12} \sim \mathrm{N} \left[\pi_{12},\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}\right]\\ p_{21} \sim \mathrm{N} \left[\pi_{21},\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}\right]\\ p_{1\bullet } \sim \mathrm{N} \left[\pi_{1\bullet },\frac{\pi_{1\bullet } \left(1-\pi_{1\bullet }\right)}{N}\right]\\ p_{\bullet 1} \sim \mathrm{N} \left[\pi_{\bullet 1},\frac{\pi_{\bullet 1} \left(1-\pi_{\bullet 1}\right)}{N}\right]\\ \end{gather} ここで、和の分散の公式より、 \begin{align} V \left(p_{12}-p_{21}\right)&=V \left(p_{12}\right)+V \left(p_{21}\right)-2\mathrm{Cov} \left(p_{12},p_{21}\right)\\ &=\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}+\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}+\frac{2\pi_{12}\pi_{21}}{N}\\ &=\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N}\\ V \left(p_{1\bullet }-p_{\bullet 1}\right)&=V \left(p_{1\bullet }\right)+V \left(p_{\bullet 1}\right)-2\mathrm{Cov} \left(p_{1\bullet },p_{\bullet 1}\right)\tag{1} \end{align} いっぽう、 \begin{align} V \left(p_{1\bullet }-p_{\bullet 1}\right)&=V \left[ \left(p_{11}+p_{12}\right)- \left(p_{11}+p_{21}\right)\right]\\ &=V \left(p_{12}-p_{21}\right)\tag{2} \end{align} よって、式 $(1).(2)$ より、 \begin{align} \frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N}&=\frac{\pi_{1\bullet } \left(1-\pi_{1\bullet }\right)}{N}+\frac{\pi_{\bullet 1} \left(1-\pi_{\bullet 1}\right)}{N}-2\mathrm{Cov} \left(p_{1\bullet },p_{\bullet 1}\right)\\ 2\mathrm{Cov} \left(p_{1\bullet },p_{\bullet 1}\right)&=\frac{\pi_{1\bullet } \left(1-\pi_{1\bullet }\right)}{N}+\frac{\pi_{\bullet 1} \left(1-\pi_{\bullet 1}\right)}{N}-\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N}\\ &=\frac{\pi_{1\bullet }-\pi_{1\bullet }^2}{N}+\frac{\pi_{\bullet 1}-\pi_{\bullet 1}^2}{N}-\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N}\\ &=\frac{ \left(\pi_{11}+\pi_{12}\right)- \left(\pi_{11}+\pi_{12}\right)^2}{N}+\frac{ \left(\pi_{11}+\pi_{21}\right)- \left(\pi_{11}+\pi_{21}\right)^2}{N}-\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N}\\ &=\frac{ \left(\pi_{11}+\pi_{12}\right)- \left(\pi_{11}^2+2\pi_{11}\pi_{12}+\pi_{12}^2\right)}{N}+\frac{ \left(\pi_{11}+\pi_{21}\right)- \left(\pi_{11}^2+2\pi_{11}\pi_{21}+\pi_{21}^2\right)}{N}-\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}^2-2\pi_{12}\pi_{21}+\pi_{21}^2\right)}{N} &=\frac{2\pi_{11}-2 \left\{\pi_{11} \left(\pi_{11}+\pi_{12}+\pi_{21}\right)+\pi_{12}\pi_{21}\right\}}{N}\\ &=\frac{2 \left[\pi_{11}-\pi_{11} \left(\pi_{11}+\pi_{12}+\pi_{21}\right)-\pi_{12}\pi_{21}\right]}{N}\\ &=\frac{2 \left[\pi_{11} \left\{1- \left(\pi_{11}+\pi_{12}+\pi_{21}\right)\right\}-\pi_{12}\pi_{21}\right]}{N} &=\frac{2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}\right)}{N}\\ \mathrm{Cov} \left(p_{1\bullet },p_{\bullet 1}\right)&=\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{N} \end{align} 標本比率ベクトルを \begin{align} \boldsymbol{p}= \left(\begin{matrix}p_{1\bullet }\\p_{\bullet 1}\\\end{matrix}\right) \end{align} 期待値ベクトルを \begin{align} \boldsymbol{\pi}= \left(\begin{matrix}\pi_{1\bullet }\\\pi_{\bullet 1}\\\end{matrix}\right) \end{align} 分散・共分散行列を \begin{align} \boldsymbol{\Omega}= \left[\begin{matrix}\frac{\pi_{1\bullet } \left(1-\pi_{1\bullet }\right)}{N}&\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{N}\\\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{N}&\frac{\pi_{\bullet 1} \left(1-\pi_{\bullet 1}\right)}{N}\\\end{matrix}\right] \end{align} として、 \begin{gather} G \left(\boldsymbol{\pi}\right)=\theta=\log{\frac{\pi_{1\bullet }}{\pi_{\bullet 1}}}\\ G \left(\boldsymbol{p}\right)=\hat{\theta}=\log{\frac{p_{1\bullet }}{p_{\bullet 1}}} \end{gather} と変数変換する。 多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\pi}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\pi}\right)}{\partial\pi_{1\bullet }}\\\frac{G \left(\boldsymbol{\pi}\right)}{\partial\pi_{\bullet 1}}\\\end{matrix}\right)= \left[\begin{matrix}\frac{1}{\pi_{1\bullet }}\\-\frac{1}{\pi_{\bullet 1}}\\\end{matrix}\right] \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[G \left(\boldsymbol{p}\right)\right]\cong G \left(\boldsymbol{\pi}\right)=\log{\frac{\pi_{1\bullet }}{\pi_{\bullet 1}}} \end{align} \begin{align} V \left[G \left(\boldsymbol{p}\right)\right]&=\frac{1}{N} \left[\begin{matrix}\frac{1}{\pi_{1\bullet }}&-\frac{1}{\pi_{\bullet 1}}\\\end{matrix}\right] \left[\begin{matrix}\pi_{1\bullet } \left(1-\pi_{1\bullet }\right)&\pi_{11}\pi_{22}-\pi_{12}\pi_{21}\\\pi_{11}\pi_{22}-\pi_{12}\pi_{21}&\pi_{\bullet 1} \left(1-\pi_{\bullet 1}\right)\\\end{matrix}\right] \left[\begin{matrix}\frac{1}{\pi_{1\bullet }}\\-\frac{1}{\pi_{\bullet 1}}\\\end{matrix}\right]\\ &=\frac{1}{N} \left[\begin{matrix}\frac{1}{\pi_{1\bullet }}&-\frac{1}{\pi_{\bullet 1}}\\\end{matrix}\right] \left[\begin{matrix}1-\pi_{1\bullet }-\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{\bullet 1}}\\\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{1\bullet }}- \left(1-\pi_{\bullet 1}\right)\\\end{matrix}\right]\\ &=\frac{1}{N} \left[\frac{1}{\pi_{1\bullet }} \left\{ \left(1-\pi_{1\bullet }\right)-\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{\bullet 1}}\right\}-\frac{1}{\pi_{\bullet 1}} \left\{\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{1\bullet }}- \left(1-\pi_{\bullet 1}\right)\right\}\right]\\ &=\frac{1}{N} \left(\frac{1-\pi_{1\bullet }}{\pi_{1\bullet }}-\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{1\bullet }\pi_{\bullet 1}}-\frac{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}}{\pi_{1\bullet }\pi_{\bullet 1}}+\frac{1-\pi_{\bullet 1}}{\pi_{\bullet 1}}\right)\\ &=\frac{\pi_{\bullet 1} \left(1-\pi_{1\bullet }\right)-2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}\right)+\pi_{1\bullet } \left(1-\pi_{\bullet 1}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{ \left(\pi_{\bullet 1}+\pi_{1\bullet }-2\pi_{1\bullet }\pi_{\bullet 1}\right)-2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{\bullet 1}+\pi_{1\bullet }-2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}+\pi_{1\bullet }\pi_{\bullet 1}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{11}+\pi_{12}+\pi_{11}+\pi_{21}-2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}+\pi_{1\bullet }\pi_{\bullet 1}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}-2 \left(\pi_{11}\pi_{22}-\pi_{12}\pi_{21}+\pi_{1\bullet }\pi_{\bullet 1}-\pi_{11}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}-2 \left\{\pi_{11}\pi_{22}-\pi_{12}\pi_{21}+ \left(\pi_{11}+\pi_{12}\right) \left(\pi_{11}+\pi_{21}\right)-\pi_{11}\right\}}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}-2 \left\{\pi_{11}\pi_{22}+\pi_{11}^2+\pi_{11} \left(\pi_{12}+\pi_{21}\right)-\pi_{11}\right\}}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}-2 \left\{\pi_{11} \left(\pi_{11}+\pi_{12}+\pi_{21}+\pi_{22}\right)-\pi_{11}\right\}}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}-2 \left(\pi_{11} \cdot 1-\pi_{11}\right)}{N\pi_{1\bullet }\pi_{1\bullet }}\\ &=\frac{\pi_{12}+\pi_{21}}{N\pi_{1\bullet }\pi_{1\bullet }} \end{align} 母比率 $\pi_i$ を一致推定量である標本比率 $p_i$ で置き換えると、漸近分散の一致推定量は、 \begin{align} \hat{V} \left[\hat{\theta}\right]=\frac{p_{12}+p_{21}}{Np_{1\bullet }p_{\bullet 1}}=\frac{M}{Nn_{1\bullet }n_{\bullet 1}} \end{align} $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.259
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.227-232

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ