ジョン・ラチン(2020)『医薬データのための統計解析』 問題4.1 解答例

公開日: 更新日:

【2022年10月4週】 【A000】生物統計学 【A062】層別解析

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題4.1」の自作解答例です。コクラン検定統計量の重み付き平均としての表現に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題4.1:コクラン検定統計量の別表現

非曝露群の発症人数 $b_k$ について、 \begin{gather} E \left(b\right)=n_{2k}\pi_k \quad \hat{E} \left(b\right)=\frac{m_{1k}n_{2k}}{N}\\ V \left(b_k\right)=n_{2k}\pi_k \left(1-\pi_k\right) \quad \hat{V} \left(b_k\right)=\frac{m_{1k}m_{2k}n_{2k}}{N_k^2} \end{gather} $m_{1k}=a_k+b_k$ の関係があるので、実測値と期待値の一致推定量の差は、 \begin{align} a_k-\hat{E} \left(a_k\right)&=a_k-\frac{m_{1k}n_{1k}}{N_k}\\ &=\frac{a_k \left(n_{1k}+n_{2k}\right)- \left(a_k+b_k\right)n_{1k}}{N_k}\\ &=\frac{n_{2k}a_k-n_{1k}b_k}{N_k}\tag{1} \end{align} ここで、$a_k=n_{1k}p_{1k},b_k=n_{2k}p_{2k}$ を代入すると、 \begin{align} a_k-\hat{E} \left(a_k\right)&=\frac{n_{2k}n_{1k}p_{1k}-n_{1k}n_{2k}p_{2k}}{N_k}\\ &=\frac{n_{1k}n_{2k}}{N_k} \left(p_{1k}-p_{2k}\right) \end{align} よって、 \begin{align} {\hat{w}}_k=\frac{n_{1k}n_{2k}}{N_k}=\frac{1}{\frac{1}{n_{1k}}+\frac{1}{n_{2k}}} \end{align} とすると、 \begin{align} a_k-\hat{E} \left(a_k\right)={\hat{w}}_k \left(p_{1k}-p_{2k}\right)\tag{2} \end{align} また、式 $(1)$ の分散を取ると、 \begin{align} V \left[a_k-\hat{E} \left(a_k\right)\right]&=V \left[\frac{n_{2k}a_k-n_{1k}b_k}{N_k}\right]\\ &=\frac{n_{2k}^2V \left(a_k\right)+n_{1k}^2V \left(b_k\right)}{N_k^2} \end{align} 一致推定量は、$\pi_k=p_k$ を代入して、 \begin{align} \hat{V} \left[a_k-\hat{E} \left(a_k\right)\right]&=\frac{n_{2k}^2}{N_k^2} \cdot \frac{m_{1k}m_{2k}n_{1k}}{N_k^2}+\frac{n_{1k}^2}{N_k^2} \cdot \frac{m_{1k}m_{2k}n_{2k}}{N_k^2}\\ &=\frac{m_{1k}m_{2k}n_{1k}n_{2k}}{N_k^4} \left(n_{1k}+n_{2k}\right)\\ &=\frac{m_{1k}m_{2k}n_{1k}n_{2k}}{N_k^3} \end{align} ここで、$p_k=\frac{m_{1k}}{N_k},1-p_k=\frac{m_{2k}}{N_k}$ を代入すると、 \begin{align} \hat{V} \left[a_k-\hat{E} \left(a_k\right)\right]=\frac{n_{1k}n_{2k}}{N_k}p_k \left(1-p_k\right) \end{align} よって、${\hat{V}}_{0k}=p_k \left(1-p_k\right) \left(\frac{N_k}{n_{1k}n_{2k}}\right)$ とすると、 \begin{align} \hat{V} \left[a_k-\hat{E} \left(a_k\right)\right]={\hat{w}}_k^2{\hat{V}}_{0k} \end{align} 二項分布の正規近似より、 \begin{align} a_k-\hat{E} \left(a_k\right) \sim \mathrm{N} \left[0,{\hat{w}}_k^2{\hat{V}}_{0k}\right] \end{align} 各層は互いに独立なので、正規分布の再生性より、 \begin{align} \sum_{k=1}^{K} \left\{a_k-\hat{E} \left(a_k\right)\right\} \sim \mathrm{N} \left[0,\sum_{k=1}^{K}{{\hat{w}}_k^2{\hat{V}}_{0k}}\right] \end{align} これを標準化した値は、 \begin{align} \frac{\sum_{k=1}^{K} \left\{{\hat{w}}_k \left(p_{1k}-p_{2k}\right)\right\}}{\sqrt{\sum_{k=1}^{K}{{\hat{w}}_k^2{\hat{V}}_{0k}}}}=Z_{\mathrm{C}} \sim \mathrm{N} \left(0,1\right) \end{align} したがって、$\chi^2$分布の定義より、 \begin{align} \chi_{\mathrm{C}}^2=\frac{ \left[\sum_{k=1}^{K}{{\hat{w}}_k \left(p_{1k}-p_{2k}\right)}\right]^2}{\sum_{k=1}^{K}{{\hat{w}}_k^2{\hat{V}}_{0k}}} \end{align} $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.204-205
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.132-135

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ