ジョン・ラチン(2020)『医薬データのための統計解析』 問題6.2 解答例

公開日:

【2022年11月3週】 【A000】生物統計学 【A092】ロジスティック回帰分析

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題6.2」の自作解答例です。ロジスティック・モデルによる対数オッズ比の最尤推定(積二項分布モデル)に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる(0に確率収束する)と仮定しています。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題6.2.1:尤度・対数尤度

積二項尤度の基本式より、 L(π1,π2)=n1Caπ1a(1π1)n1an2Cbπ2b(1π2)n2b 対数尤度関数の定義式 l(θ,x)=logL(θ,x) より、 l(π1,π2)=log[n1Caπ1a(1π1)n1an2Cbπ2b(1π2)n2b]=logn1Ca+alogπ1+(n1a)log(1π1)+logn2Cb+blogπ2+(n2b)log(1π2) logn1Ca+logn2Cb=C とすると、n1a=c,n2b=d より、 l(π1,π2)=alogπ1+clog(1π1)+blogπ2+dlog(1π2)+C

問題6.2.2:スコア関数①

対数尤度をパラメータ α,β およびの周辺度数 n1,n2,m1,m2 で表すと、 l(π1,π2)=alog(eα+β1+eα+β)+clog(11+eα+β)+blog(eα1+eα)+dlog(11+eα)+C=alog(eα+β)alog(1+eα+β)clog(1+eα+β)+blog(eα)blog(1+eα)dlog(1+eα)+C=alog(eα+β)(a+c)log(1+eα+β)+blog(eα)(b+d)log(1+eα)+C 各セル度数どうしの関係より、 a+c=n1b+d=n2a+b=m1 よって、 l(π1,π2)=a(α+β)n1log(1+eα+β)+bαn2log(1+eα)+C=(a+b)α+aβn1log(1+eα+β)n2log(1+eα)+C=m1α+aβn1log(1+eα+β)n2log(1+eα)+C この対数尤度関数を α で偏微分すると、 Uα(θ)=m1n1eα+β1+eα+βn2eα1+eα ロジスティック・モデルの仮定より、 π1=eα+β1+eα+βπ2=eα1+eα よって、 Uα(θ)=m1n1π1n2π2

問題6.2.3:スコア関数②

同様に、対数尤度関数を β で偏微分すると、 Uβ(θ)=an1eα+β1+eα+β=an1π1

問題6.2.4:連鎖律によるスコア方程式の導出

尤度方程式は、連鎖律(多変数関数の合成関数の微分)を用いても得られる。
連鎖律の定義式は、 f(x,y)x=f(x,y)uux+f(x,y)vvx,f(x,y)y=f(x,y)uuy+f(x,y)vvy よって、 Uα(θ)=lπ1π1α+lπ2π2α ここで、 π1l(θ)=aπ1c1π1π2l(θ)=bπ2d1π2π1α=eα+β(1+eα+β)2=π1(1π1)π2α=eα(1+eα)2=π2(1π2) よって、 Uα(θ)={aπ1c1π1}π1(1π1)+{bπ2d1π2}π2(1π2)=a(1π1)cπ1+b(1π2)dπ2=a+b(a+c)π1(b+d)π2=m1n1π1n2π2 同様に、 Uβ(θ)=lπ1π1βπ1l(θ)=aπ1c1π1π1β=eα+β(1+eα+β)2=π1(1π1) よって、 Uβ(θ)={aπ1c1π1}π1(1π1)=a(1π1)cπ1=an1π1

問題6.2.5:ヘッセ行列

ヘッセ行列の成分の定義より、 Hα(θ)=2α2l(θ)=n1eα+β(1+eα+β)2n2eα(1+eα)2=n1π1(1π1)n2π2(1π2) Hβ(θ)=2β2l(θ)=n1eα+β(1+eα+β)2=n1π1(1π1) Hαβ(θ)=2αβl(θ)=n1eα+β(1+eα+β)2=n1π1(1π1) 観測情報行列の定義 i(θ)=H(θ) と二項分布における期待情報行列との関係 i(θ)=I(θ) から I(θ)=i(θ)=[Hα(θ)Hαβ(θ)Hαβ(θ)Hβ(θ)]=[n1π1(1π1)+n2π2(1π2)n1π1(1π1)n1π1(1π1)n1π1(1π1)] [別解]ヘッセ行列の各要素、連鎖律(多変数関数の合成関数の微分)を用いても得られる。
Hβ(θ)=2β2l(θ)=βUβ(θ)=β(lπ1π1β)=β(an1eα+β1+eα+β)=n1eα+β(1+eα+β)2=n1π1(1π1) Hα(θ)=2α2l(θ)=αUα(θ)=α(lπ1π1α+lπ2π2α)=α(m1n1eα+β1+eα+βn2eα1+eα)=n1eα+β(1+eα+β)2n2eα(1+eα)2=n1π1(1π1)n2π2(1π2) Hαβ(θ)=2αβl(θ)=αUβ(θ)=α(lπ1π1β)=α(an1eα+β1+eα+β)=n1eα+β(1+eα+β)2=n1π1(1π1)

問題6.2.6:最尤推定量

最尤推定量 U(θ^)=0 を求めると、 (1)Uα(α^,β^)=m1n1π1n2π2=0(2)Uβ(α^,β^)=an1π1=0 この連立方程式を解くと、 π2=m1an2=bn2eα^1+eα^=bn2eα^=bn2b=bdα^=logbd この結果と式 (2) より、 an1eα^+β^1+eα^+β^=0 これを β^ について解くと、 (1+eα^+β^)an1eα^+β^=0a+aeα^+β^n1eα^+β^=0a+(an1)eα^eβ^=0acbdeβ^=0eβ^=adbcβ^=logadbc

問題6.2.7:スコア方程式

得られた最尤推定量より、 α^=logbdβ^=logadbceα^=bdeα^+β^=acπ1=ac1+ac=ac+a=an1π2=bd1+bd=bd+b=bn2 これらをスコア方程式に代入すると、 Uβ(θ)=an1π1=an1an1=aa=0Uα(θ)=m1n1π1n2π2=m1n1an1n2bn2=m1ab=0

問題6.2.8:期待情報行列

期待情報行列の成分は、 I(θ)=[Iα(θ)Iαβ(θ)Iαβ(θ)TIβ(θ)] このとき、推定量の共分散行列は、V(θ^)=I(θ)1 となる。期待情報行列の逆行列は、 I(θ)1=1|I(θ)|[Iβ(θ)Iαβ(θ)TIαβ(θ)Iα(θ)] 2×2行列の行列式の公式 |A|=a11a22a12a21 より、 |I(θ)|={n1π1(1π1)+n2π2(1π2)}n1π1(1π1){n1π1(1π1)}2={n1π1(1π1)+n2π2(1π2)n1π1(1π1)}n1π1(1π1)=n1π1(1π1)n2π2(1π2) π1(1π1)=ψ1,π2(1π2)=ψ2 とすると、 |I(θ)|=n1ψ1n2ψ2 したがって、 I(θ)1=1n1ψ1n2ψ2[n1ψ1n1ψ1n1ψ1n1ψ1+n2ψ2]=[1n2ψ21n2ψ21n2ψ2n1ψ1+n2ψ2n1ψ1n2ψ2]

問題6.2.9:漸近分散・共分散行列

別な表現として、 I(θ)1=[[I(θ)1]α[I(θ)1]α,β[I(θ)1]α,βT[I(θ)1]β] したがって、推定量の共分散行列は、 V(α^)=[I(θ)1]α=1n2π2(1π2)V(β^)=[I(θ)1]β=n1π1(1π1)+n2π2(1π2)n1π1(1π1)n2π2(1π2)=1n1π1(1π1)+1n2π2(1π2)Cov(α^,β^)=[I(θ)1]α,β=1n2π2(1π2)

問題6.2.10:標本対数オッズ比の漸近分散

推定量の共分散行列に、ロジスティック・モデルの各値を代入すると、 V(β^)=1n1eα+β1+eα+β11+eα+β+1n2eα1+eα11+eα=(1+eα+β)2n1eα+β+(1+eα)2n2eα この最尤推定量は、α=α^,β=β^ を代入して、 V^(β^)=(1+eα^+β^)2n1eα^+β^+(1+eα^)2n2eα^=(1+ac)2n1ac+(1+bd)2n2bd=(a+c)2c2can1+(b+d)2d2dbn2=(a+c)2acn1+(b+d)2bdn2 a+c=n1,b+d=n2 より、 V^(β^)=a+cac+b+dbd 各項を部分分数分解すると、 V^(β^)=1a+1b+1c+1d

問題6.2.11:ワルド検定統計量

ワルド検定の検定統計量の定義 χW2=β^2V^(β^) より、 χW2=(logadbc)2[1a+1b+1c+1d]

問題6.2.13:尤度比検定

対数尤度の式より、帰無仮説 β=0 における対数尤度は、 l(π1,π2)=m1α+aβn1log(1+eα+β)n2log(1+eα)l(α^,0)=m1α+a0n1log(1+eα+0)n2log(1+eα)=m1α(n1+n2)log(1+eα)=m1αNlog(1+eα) この対数尤度関数を α で偏微分すると、スコア関数は、 Uα(θ)=m1Neα1+eα 尤度方程式 Uα(θ)=0 を解くことによって得られる α の最尤推定量は、 m1Neα^01+eα^0=0eα^01+eα^0=m1N(1m1N)eα^0=m1Neα^0=m1NNNm1eα^0=m1m2α^0=logm1m2 尤度比検定の検定統計量の定義 χLR2=2logL(α^,β^)2logL(α^,0) より、 χLR2=2{m1α^+aβ^n1log(1+eα^+β^)n2log(1+eα)}2{m1α^0Nlog(1+eα^0)}=2{m1(α^α^0)+aβ^n1log(1+eα^+β^)n2log(1+eα)+Nlog(1+eα^0)}=2{m1(logbdlogm1m2)+alogadbcn1log(1+ac)n2log(1+bd)+Nlog(1+m1m2)}=2{m1logbm2dm1+alogadbcn1logn1cn2logn2d+NlogNm2}=2(m1logbm2dm1+alogadbc+n1logcn1+n2logdn2+NlogNm2)=2(logbm1m2m1dm1m1m1+logaadabaca+logcn1n1n1+logdn2n2n2+logNNm2N)=2log[bm1m2m1dm1m1m1aadabacacn1n1n1dn2n2n2NNm2N]=2log[aaNNn1n1n2n2m1m1bm1bacn1cadadn2dm1m2m1m2N]=2log[aaNNn1n1n2n2m1m1ba+baca+cada+b+d(a+b)m2(m1+m2)m1]=2log[aabbccddNNn1n1n2n2m1m1m2m2]

問題6.2.14:スコア方程式と推定情報行列

β に関する、スコア関数は、帰無仮説 β=0 においては、 Uβ(θ)=an1eα^01+eα^0=an1m1m21+m1m2=an1m1N=aE^(a) 帰無仮説のもとで π1=π2=π であり、 π^=eα^01+eα^0=m1N これを、期待情報行列 I(θ) の式に代入すると、 I(θ^0)=[n1π^(1π^)+n2π^(1π^)n1π^(1π^)n1π^(1π^)n1π^(1π^)]=π^(1π^)[Nn1n1n1]

問題6.2.15:有効スコア検定とコクラン検定の同等性

期待情報行列の逆行列 I(θ)1 の式に代入すると、 I(θ^0)1=[1n2π^(1π^)1n2π^(1π^)1n2π^(1π^)n1π^(1π^)+n2π^(1π^)n1π^(1π^)n2π^(1π^)]=1π^(1π^)[1n21n21n2Nn1n2]=1π^(1π^)1Nn1n12[n1n1n1N] また、帰無仮説のもとで β に対応する推定情報量の逆行列の成分は、 V(β^)=[I(θ)1]β=Nn1n2π^(1π^)=N3n1n2m1m2 結果として有効スコア検定 χ2=β^2V^(β^) は、 χ2=[an1m1N]2n1n2m1m2N3=[aE^(a)]2V^[aE^(a)] これは、2×2 表に対するコクラン検定と等しい。

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.295-296
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.269-275

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ