ジョン・ラチン(2020)『医薬データのための統計解析』 問題6.4 解答例

公開日:

【2022年11月4週】 【A000】生物統計学 【A092】ロジスティック回帰分析

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題6.4」の自作解答例です。積二項尤度にもとづく対数リスク比のロジスティック回帰モデルに関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる(0に確率収束する)と仮定しています。
  • 上述の参考書では、標準正規分布の上側 100α% 点を Z1α と表記していますが、本サイトでは、Zα としています。そのため、参考書に載っている式の形式と異なる部分があります。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題6.4.1:スコア関数①

積二項尤度の基本式より、 L(π1,π2)=n1Caπ1a(1π1)n1an2Cbπ2b(1π2)n2b 対数尤度関数の定義 l(θ,x)=logL(θ,x) より、 l(π1,π2)=log[n1Caπ1a(1π1)n1an2Cbπ2b(1π2)n2b]=logn1Ca+alogπ1+(n1a)log(1π1)+logn2Cb+blogπ2+(n2b)log(1π2) logn1Ca+logn2Cb=C とすると、各セルどうしの関係、対数リスクモデルの仮定より、 n1a=cn2b=da+b=m1logπ1=α+βlogπ2=α よって、 l(π1,π2)=alogπ1+clog(1π1)+blogπ2+dlog(1π2)+C=alog(eα+β)+clog(1eα+β)+blog(eα)+dlog(1eα)+C=a(α+β)+clog(1eα+β)+bα+dlog(1eα)+C=(a+b)α+aβ+clog(1eα+β)+dlog(1eα)+C=m1α+aβ+clog(1eα+β)+dlog(1eα)+C パラメータ α のスコア関数は、この対数尤度関数を α で偏微分して、 Uα(θ)=m1ceα+β1eα+βdeα1eα=m1cπ11π1dπ21π2

問題6.4.2:スコア関数②

同様に、パラメータ β のスコア関数は、この対数尤度関数を β で偏微分して、 Uβ(θ)=aceα+β1eα+β=acπ11π1

問題6.4.3:最尤推定量

最尤推定量の定義 U(θ^)=0 より、 (1)Uα(α^,β^)=m1cπ11π1dπ21π2=0(2)Uβ(α^,β^)=acπ11π1=0 この連立方程式を解くと、 m1adeα^1eα^=0eα^1eα^=bdeα^=bdbdeα^(1+bd)eα^=bd(d+bd)eα^=bdeα^=bddd+beα^=dd+b=bn2α^=logbn2 eα^+β^1eα^+β^=aceα^+β^=acaceα^+β^(1+ac)eα^+β^=aceα^+β^=acca+c=an1eβ^bn2=an1eβ^=an2bn1β^=logan2bn1=logRR^

問題6.4.4:期待情報行列

ヘッセ行列の成分の定義と c=n1(1π1),d=n2(1π2) より、 Hα(θ)=2α2l(θ)=ceα+β(1eα+β)2deα(1eα)2=cπ1(1π1)2dπ2(1π2)2=n1π11π1n2π21π2 Hβ(θ)=2β2l(θ)=ceα+β(1eα+β)2=cπ1(1π1)2=n1π11π1 Hαβ(θ)=2αβl(θ)=ceα+β(1eα+β)2=cπ1(1π1)2=n1π11π1 観測情報行列の定義 i(θ)=H(θ) と二項分布における期待情報行列との関係 i(θ)=I(θ) から、ψi=πi1πi とすると、 I(θ)=i(θ)=[Hα(θ)Hαβ(θ)Hαβ(θ)Hβ(θ)]=[n1ψ1+n2ψ2n1ψ1n1ψ1n1ψ1]

問題6.4.5:漸近分散・共分散行列

期待情報行列の成分は、 I(θ)=[Iα(θ)Iαβ(θ)Iαβ(θ)TIβ(θ)] このとき、推定量の共分散行列は、V(θ^)=I(θ)1 となる。期待情報行列の逆行列は、 I(θ)1=1|I(θ)|[Iβ(θ)Iαβ(θ)TIαβ(θ)Iα(θ)] 2×2行列の行列式の公式 |A|=a11a22a12a21 より、 |I(θ)|=(n1ψ1+n2ψ2)n1ψ1{n1ψ1}2=(n1ψ1+n2ψ2n1ψ1)n1ψ1=n1ψ1n2ψ2 したがって、 V(α^,β^)=I(θ)1=1n1ψ1n2ψ2[n1ψ1n1ψ1n1ψ1n1ψ1+n2ψ2]=[1n2ψ21n2ψ21n2ψ2n1ψ1+n2ψ2n1ψ1n2ψ2] したがって、推定量の共分散行列の成分は、 V(α^)=[I(θ)1]α=1π2n2π2 V(β^)=[I(θ)1]β=1n1ψ1+1n2ψ2=1π1n1π1+1π2n2π2 Cov(α^,β^)=[I(θ)1]α,β=1π2n2π2

問題6.4.6:対数リスク比の推定分散

この一致推定量は、π^1=p1=eα^+β^=an2bn1,π^2=p2=eα^=bn2 を代入して、 V^(β^)=V^(logRR^)=1p1n1p1+1p2n2p2=1p1a+1p2b=1ap1a+1bp2b a=n1p1,b=n2p2 なので、 V^(logRR^)=1a1n1+1b1n2

問題6.4.7:帰無仮説のもとでの共通の母比率の最尤推定量

対数尤度の式より、帰無仮説 β=0 における対数尤度は、 l(π1,π2)=m1α+aβ+clog(1eα+β)+dlog(1eα)l(α^,0)=logL(α^,0)=m1α+a0+clog(1eα+0)+dlog(1eα)=m1α+clog(1eα)+dlog(1eα)=m1α+m2log(1eα) パラメータ α のスコア関数は、この対数尤度関数を α で偏微分すると、 Uα(θ)=m1m2eα1eα 尤度方程式 Uα(θ)=0 を解くことによって得られる α の最尤推定量は、 m1m2eα^01eα^0=0eα^01eα^0=m1m2(1+m1m2)eα^0=m1m2eα^0=m1m2m2m1+m2eα^0=m1Nα^0=logm1N したがって、共通の発症確率 π1=π2=π の最尤推定量は、 π^=m1N

問題6.4.8:帰無仮説のもとでのスコア方程式

β に関するスコア関数 Uβ(θ)=aceα+β1eα+β は、帰無仮説 β=0 においては、 Uβ(θ)=an1eα^01+eα^0=acm1N1m1N=acm1m2

問題6.4.9:帰無仮説のもとでの推定情報行列

また、帰無仮説のもとで β に対応する推定情報量の逆行列の成分は、 V(β^)=[I(θ)1]β=1π^n1π^+1π^n2π^=1π^π^(1n1+1n2)=1m1Nm1N(1n1+1n2)=m2m1(1n1+1n2)=m2m1n1+n2n1n2=m2m1Nn1n2

問題6.4.10:有効スコア検定

結果として有効スコア検定 χ2={Uβ(θ)}2V^(β^) は、 χ2=(acm1m2)2(m1m2n1n2N)

問題6.4.12:スコアにもとづく共通対数リスク比の推定値

スコアにもとづく推定値の公式 θ^0=U(θ0)I(θ0) より、 β^=(acm1m2)(m1m2n1n2N) また、スコアにもとづく推定値の分散の公式 V(θ^0)=1I(θ0) より、 V(β^)=m1m2n1n2N

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.297-298

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ