ジョン・ラチン(2020)『医薬データのための統計解析』 問題6.6 解答例

公開日: 更新日:

【2022年11月4週】 【A000】生物統計学 【A092】ロジスティック回帰分析

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題6.6」の自作解答例です。積二項尤度にもとづく共通オッズ比のロジスティック回帰モデルの適用についての問題です。特に、回帰係数に関する有効スコア検定と層別解析におけるコクラン検定の同等性は非常に重要です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる($0$に確率収束する)と仮定しています。
  • 上述の参考書では、標準正規分布の上側 $100\alpha\%$ 点を $Z_{1-\alpha}$ と表記していますが、本サイトでは、$Z_\alpha$ としています。そのため、参考書に載っている式の形式と異なる部分があります。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題6.6.1:スコア関数

積二項尤度の基本式より、$k$ 番目の層について、 \begin{align} L \left(\pi_{1k},\pi_{2k}\right)={}_{n_{1k}}C_{a_k}\pi_{1k}^{a_k} \left(1-\pi_{1k}\right)^{c_k} \cdot {}_{n_{2k}}C_{b_k}\pi_{2k}^{b_k} \left(1-\pi_{2k}\right)^{d_k} \end{align} 対数尤度関数の定義式 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ より、定数項を無視すると、 \begin{align} l \left(\pi_{1k},\pi_{2k}\right)&=\log{ \left[{}_{n_{1k}}C_{a_k}\pi_{1k}^{a_k} \left(1-\pi_{1k}\right)^{c_k} \cdot {}_{n_{2k}}C_{b_k}\pi_{2k}^{b_k} \left(1-\pi_{2k}\right)^{d_k}\right]}\\ &=\log{{}_{n_{1k}}C_{a_k}}+\alpha_k\log{\pi_{1k}}+c_k\log{ \left(1-\pi_{1k}\right)}+\log{{}_{n_{2k}}C_{b_k}}+b_k\log{\pi_{2k}}+d_k\log{ \left(1-\pi_{2k}\right)}\\ &=a_k\log{\pi_{1k}}+c_k\log{ \left(1-\pi_{1k}\right)}+b_k\log{\pi_{2k}}+d_k\log{ \left(1-\pi_{2k}\right)} \end{align} この尤度をパラメータ $\alpha_k,\beta$ で表すと、 \begin{align} l \left(\alpha_k,\beta\right)&=a_k\log{ \left(\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}\right)}+c_k\log{ \left(\frac{1}{1+e^{\alpha_k+\beta}}\right)}+b_k\log{ \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)}+d_k\log{ \left(\frac{1}{1+e^{\alpha_k}}\right)}\\ &=a_k\log{ \left(e^{\alpha_k+\beta}\right)}-a_k\log{ \left(1+e^{\alpha_k+\beta}\right)}-c_k\log{ \left(1+e^{\alpha_k+\beta}\right)}+b_k\log{ \left(e^{\alpha_k}\right)}-b_k\log{ \left(1+e^{\alpha_k}\right)}-d_k\log{ \left(1+e^{\alpha_k}\right)}\\ &=a_k\log{ \left(e^{\alpha_k+\beta}\right)}- \left(a_k+c_k\right)\log{ \left(1+e^{\alpha_k+\beta}\right)}+b_k\log{ \left(e^{\alpha_k}\right)}- \left(b_k+d_k\right)\log{ \left(1+e^{\alpha_k}\right)}\\ &=a_k \left(\alpha_k+\beta\right)-n_{1k}\log{ \left(1+e^{\alpha_k+\beta}\right)}+b_k\alpha_k-n_{2k}\log{ \left(1+e^{\alpha_k}\right)}\\ &= \left(a_k+b_k\right)\alpha_k+a_k\beta-n_{1k}\log{ \left(1+e^{\alpha_k+\beta}\right)}-n_{2k}\log{ \left(1+e^{\alpha_k}\right)}\\ &=m_{1k}\alpha_k+a_k\beta-n_{1k}\log{ \left(1+e^{\alpha_k+\beta}\right)}-n_{2k}\log{ \left(1+e^{\alpha_k}\right)} \end{align} 各層が独立なとき、全体としての尤度は、 \begin{gather} L \left(\boldsymbol{\theta}\right)=\prod_{k=1}^{K}L \left(\alpha_k,\beta\right) \quad \boldsymbol{\theta}= \left\{\begin{matrix}\alpha_1\\\vdots\\\alpha_K\\\beta\\\end{matrix}\right\} \end{gather} 対数尤度は、 \begin{align} l \left(\boldsymbol{\theta}\right)=\sum_{k=1}^{K}l \left(\alpha_k,\beta\right) \end{align} これを $\alpha_k$ で偏微分すると、 \begin{align} U_{\alpha_k} \left(\boldsymbol{\theta}\right)&=m_{1k}-n_{1k} \cdot \frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}-n_{2k} \cdot \frac{e^{\alpha_k}}{1+e^{\alpha_k}}\\ &=m_{1k}-n_{1k}\pi_{1k}-n_{2k}\pi_{2k} \end{align} 同様に、$\beta$ で偏微分すると、 \begin{align} U_\beta \left(\boldsymbol{\theta}\right)&=\sum_{i=1}^{K} \left(a_k-n_{1k} \cdot \frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}\right)\\ &=\sum_{i=1}^{K} \left(a_k-n_{1k}\pi_{1k}\right) \end{align} $\blacksquare$

問題6.6.2:ヘッセ行列

ヘッセ行列の成分の定義式より、 \begin{align} H_{\alpha_k} \left(\boldsymbol{\theta}\right)&=\frac{\partial}{\partial\alpha_k}U_{\alpha_k} \left(\boldsymbol{\theta}\right)\\ &=-n_{1k} \cdot \left[\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}- \left(\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}\right)^2\right]-n_{2k} \cdot \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]\\ &=-n_{1k}\pi_{1k} \left(1-\pi_{1k}\right)-n_{2k}\pi_{2k} \left(1-\pi_{2k}\right) \end{align} \begin{align} H_\beta \left(\boldsymbol{\theta}\right)&=\frac{\partial}{\partial\beta}U_\beta \left(\boldsymbol{\theta}\right)\\ &=-\sum_{k=1}^{K}{n_{1k} \left[\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}- \left(\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}\right)^2\right]}\\ &=-\sum_{k=1}^{K} \left[n_{1k}\pi_{1k} \left(1-\pi_{1k}\right)\right] \end{align} \begin{align} H_{\alpha_k\beta} \left(\boldsymbol{\theta}\right)&=\frac{\partial}{\partial\alpha_k}U_\beta \left(\boldsymbol{\theta}\right)=\frac{\partial}{\partial\beta}U_{\alpha_k} \left(\boldsymbol{\theta}\right)\\ &=-n_{1k} \left[\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}- \left(\frac{e^{\alpha_k+\beta}}{1+e^{\alpha_k+\beta}}\right)^2\right]\\ &=-n_{1k}\pi_{1k} \left(1-\pi_{1k}\right) \end{align} $\blacksquare$

問題6.6.3:帰無仮説のもとでのスコア方程式

帰無仮説 $H_0:\beta=\beta_0=0$ のもとでの $\alpha_k$ のスコア関数は、 \begin{align} U_{\alpha_k} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)&=m_{1k}-n_{1k} \cdot \frac{e^{\alpha_k}}{1+e^{\alpha_k}}-n_{2k} \cdot \frac{e^{\alpha_k}}{1+e^{\alpha_k}}\\ &=m_{1k}- \left(n_{1k}+n_{2k}\right)\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\\ &=m_{1k}-N\frac{e^{\alpha_k}}{1+e^{\alpha_k}} \end{align} 最尤推定量の定義式 $U \left(\hat{\theta}\right)=0$ より、 \begin{gather} 0=m_{1k}-N\frac{e^{{\hat{\alpha}}_k}}{1+e^{{\hat{\alpha}}_k}}\\ \frac{e^{{\hat{\alpha}}_k}}{1+e^{{\hat{\alpha}}_k}}=\frac{m_{1k}}{N}\\ e^{{\hat{\alpha}}_k}=\frac{m_{1k}}{N} \left(1+e^{{\hat{\alpha}}_k}\right)\\ \left(1-\frac{m_{1k}}{N}\right)e^{{\hat{\alpha}}_k}=\frac{m_{1k}}{N}\\ e^{{\hat{\alpha}}_k}=\frac{m_{1k}}{m_{2k}}\\ {\hat{\alpha}}_k=\log{\frac{m_{1k}}{m_{2k}}} \end{gather} 同様に、帰無仮説のもとでの $\beta$ のスコア関数は、 \begin{align} U_\beta \left(\boldsymbol{\theta}_\boldsymbol{0}\right)&=\sum_{i=1}^{K} \left(a_k-n_{1k} \cdot \frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)\\ \end{align} スコア方程式 $U \left(\hat{\theta}\right)=0$ を求めると、 \begin{gather} 0=\sum_{i=1}^{K} \left(a_k-n_{1k} \cdot \frac{e^{{\hat{\alpha}}_k}}{1+e^{{\hat{\alpha}}_k}}\right)\\ 0=\sum_{i=1}^{K} \left(a_k-n_{1k} \cdot \frac{\frac{m_{1k}}{m_{2k}}}{1+\frac{m_{1k}}{m_{2k}}}\right)\\ 0=\sum_{i=1}^{K} \left(a_k-n_{1k} \cdot \frac{m_{1k}}{m_{2k}+m_{1k}}\right)\\ 0=\sum_{i=1}^{K} \left(a_k-\frac{n_{1k}m_{1k}}{N}\right) \end{gather} $\blacksquare$

問題6.6.4:帰無仮説のもとでの推定情報行列

帰無仮説 $H_0:\pi_{1k}=\pi_{2k}=\pi_k$ のもとでのヘッセ行列の成分は、 \begin{align} H_{\alpha_k} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)&=-n_{1k} \cdot \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]-n_{2k} \cdot \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]\\ &=-N_k \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]\\ &=-N_k \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]\\ &=-N_k\pi_k \left(1-\pi_k\right) \end{align} \begin{align} H_\beta \left(\boldsymbol{\theta}_\boldsymbol{0}\right)&=-\sum_{k=1}^{K}{n_{1k} \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]}\\ &=-\sum_{k=1}^{K}{n_{1k}\pi_k \left(1-\pi_k\right)} \end{align} \begin{align} H_{\alpha_k\beta} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)&=-n_{1k} \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]\\ &=-n_{1k}\pi_k \left(1-\pi_k\right) \end{align} 二項分布における期待情報行列 $\boldsymbol{I} \left(\boldsymbol{\theta}\right)=\boldsymbol{i} \left(\boldsymbol{\theta}\right)=-\boldsymbol{H} \left(\boldsymbol{\theta}\right)$ の成分は、 \begin{gather} I_{\alpha_k} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=N_k \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]=N_k\pi_k \left(1-\pi_k\right)\\ I_\beta \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=\sum_{k=1}^{K}{n_{1k} \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]}=\sum_{k=1}^{K}{n_{1k}\pi_k \left(1-\pi_k\right)}\\ I_{\alpha_k\beta} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=n_{1k} \left[\frac{e^{\alpha_k}}{1+e^{\alpha_k}}- \left(\frac{e^{\alpha_k}}{1+e^{\alpha_k}}\right)^2\right]=-n_{1k}\pi_k \left(1-\pi_k\right) \end{gather} この最尤推定量は、${\hat{\alpha}}_k=\log{\frac{m_{1k}}{m_{2k}}}$ を代入すると、 \begin{gather} I_{\alpha_k} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=N_k\frac{m_{1k}}{N_k} \left(1-\frac{m_{1k}}{N_k}\right)=\frac{m_{1k}m_{2k}}{N_k}\\ I_\beta \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=\sum_{k=1}^{K}{n_{1k}\frac{m_{1k}}{N_k} \left(1-\frac{m_{1k}}{N_k}\right)}=\sum_{k=1}^{K}\frac{n_{1k}m_{1k}m_{2k}}{N_k}\\ I_{\alpha_k\beta} \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=n_{1k}\frac{m_{1k}}{N_k} \left(1-\frac{m_{1k}}{N_k}\right)=\frac{n_{1k}m_{1k}m_{2k}}{N_k} \end{gather} $\blacksquare$

問題6.6.5:帰無仮説のもとでの漸近分散

$\blacksquare$

問題6.6.6:有効スコア検定

$\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.299-300
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.280-282

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ