ロジスティック・モデルによる共通対数オッズ比の最尤推定

公開日:

【2022年11月2週】 【A000】生物統計学 【A051】コホート研究 【A090】多変量回帰モデル 【A092】ロジスティック回帰分析

この記事をシェアする
  • B!
サムネイル画像

本稿では、層別解析にロジスティック・モデルを適用した場合の共通対数オッズ比の最尤推定について解説しています。回帰係数の有効スコア検定が層別解析に対するマンテル・ヘンツェル検定やコクラン検定と同値であることの証明が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。

層別化した分割表に対するロジスティック・モデル

マッチングなし・層化ありのコホート研究(超幾何分布モデル)において、各層の対数発症オッズ(発症確率のロジット)について、 log(π1k1π1k)=αk+βkπ1k1π1k=eαk+βklog(π0k1π0k)=αkπ0k1π0k=eαk が成り立つとする。 このとき、曝露群・非曝露群の発症確率は、ロジスティック関数として、 π1k=eαk+βk1+eαk+βk1π1k=11+eαk+βkπ0k=eαk1+eαk1π0k=11+eαk で与えられる。 また、各層の発症オッズ比 φk=ORk は、 logφk=βkφk=eβk で与えられる。

尤度のモデルとして超幾何分布モデルを仮定すると、単層の時と同様の流れで、第 k 層目の条件付き超幾何尤度は、 L(φk)=n1kCakn0kCm1kakφkaki=alkaukn1kCin0kCm1kiφki 表記の省略のため、次の Cik=n1kCin0kCm1ki という文字を用いると、 βk=logφk より、対数尤度 l(θ)=logL(θ) は、 l(φ)=log(Cikφkak)log(i=alkaukCikφki)=logCik+aklogφklog(i=alkaukCikφki)l(βk)=akβklog(i=alkaukCikφki)+C スコア関数 U(θ)=θl(θ) は、この対数尤度関数を βk で偏微分して、 U(βk)=aki=alkaukCikieiβki=alkaukCikeiβk=akE(ak|βk) 観測情報量 i(βk)=2β2l(βk) は、 i(βk)=[i=alkaukCikeiβk][i=alkaukCiki2eiβk][i=alkaukCikieiβk]2[i=alkaukCikeiβk]2=i=alkaukCiki2eiβki=alkaukCikeiβk[i=alkaukCikieiβki=alkaukCikeiβk]2 ここで、以下が成り立つので、 E(ak2|βk)=i=alkaukCiki2eiβki=alkaukCikeiβk{E(ak|βk)}2=[i=alkaukCikieiβki=alkaukCikeiβk]2 観測情報量および期待情報量は i(βk)=I(βk)=E(ak2|βk){E(ak|βk)}2=V(ak|βk)

ここで、全層を通じた共通オッズ比が存在する β1==βK=β という仮定もと、 各層の尤度は、1つのパラメータ φ=eβ のみを含むので、 各層が得られる尤度が統計的に独立であるとき、全体としての尤度関数は、K 個の各層における超幾何尤度の積 L(β)=i=1KL(βk) となる。 したがって、対数の性質 logi=1Kf(xk)=k=1Klogf(xk) から、総スコア関数は、 U(β)=i=1KU(βk)=k=1K[aki=alauCikieiβi=alauCikeiβ]=k=1K[akE(ak|β)] 同様に、総観測情報量および総期待情報量は i(β)=I(β)=i=1Ki(βk)=k=1K[i=alkaukCiki2eiβki=alkaukCikeiβk(i=alkaukCikieiβki=alkaukCikeiβk)2]=k=1K[E(ak2|β){E(ak|β)}2]=k=1KV(ak|β)

これは、帰無仮説 H0:β=β0=0 のもとでは、 U(β0)=k=1K[aki=alauCikii=alauCik]=k=1K[akE(ak|β0)] i(β)=I(β)=k=1K[E(ak2|β0){E(ak|β0)}2]=k=1KV(ak|β0)

有効スコア検定

有効スコア検定の検定統計量 χ2={U(β0)}2I(β0) は、 χS2=[k=1K[akE(ak|β0)]]2k=1KV(ak|β0) これは、層別解析におけるマンテル・ヘンツェル検定と等しいことが分かる。

スコアにもとづく推定

また、共通対数オッズ比のスコアにもとづく層調整済み推定値は、スコアにもとづく推定値の公式 θ^0=U(θ0)I(θ0) より、 β^=k=1K[akE(ak|β0)]k=1KV(ak|β0)=k=1K[akm1kn1kNk]k=1K[m1km0kn1kn0kNk2(Nk1)] また、スコアにもとづく推定値の分散の公式 V(θ^0)=1I(θ0) より、 V(β^)=1k=1KV(ak|β0)=1k=1K[m1km0kn1kn0kNk2(Nk1)]

積二項モデルにもとづく考え方

マッチングなし・層化ありのコホート研究(積二項モデル)に対しても、同様にロジスティック・モデルを仮定することができる。この場合もやはり、対数オッズ比が回帰係数と等しい βk=logφk とするモデルである。

独立した複数の層に対する積二項尤度ロジスティック・モデルと帰無仮説 すべての表において関連性が存在しない H0:β=β0=0H0:π1k=π2k=πk を仮定する。

積二項尤度の基本式より、k 番目の層について、 L(π1k,π0k)=n1kCakπ1kak(1π1k)ckn0kCbkπ0kbk(1π0k)dk 対数尤度関数の定義式 l(θ,x)=logL(θ,x) より、定数項を無視すると、 l(π1k,π0k)=log[n1kCakπ1kak(1π1k)ckn0kCbkπ0kbk(1π0k)dk]=logn1kCak+αklogπ1k+cklog(1π1k)+logn0kCbk+bklogπ0k+dklog(1π0k)=aklogπ1k+cklog(1π1k)+bklogπ0k+dklog(1π0k) この尤度をパラメータ αk,β で表すと、 l(αk,β)=aklog(eαk+β1+eαk+β)+cklog(11+eαk+β)+bklog(eαk1+eαk)+dklog(11+eαk)=aklog(eαk+β)aklog(1+eαk+β)cklog(1+eαk+β)+bklog(eαk)bklog(1+eαk)dklog(1+eαk)=aklog(eαk+β)(ak+ck)log(1+eαk+β)+bklog(eαk)(bk+dk)log(1+eαk)=ak(αk+β)n1klog(1+eαk+β)+bkαkn0klog(1+eαk)=(ak+bk)αk+akβn1klog(1+eαk+β)n0klog(1+eαk)=m1kαk+akβn1klog(1+eαk+β)n0klog(1+eαk) 各層が独立なとき、全体としての尤度は、 L(θ)=k=1KL(αk,β)θ={α1αKβ} 対数尤度は、 l(θ)=k=1Kl(αk,β) これを αk で偏微分すると、 Uαk(θ)=m1kn1keαk+β1+eαk+βn0keαk1+eαk=m1kn1kπ1kn0kπ0k 同様に、β で偏微分すると、 Uβ(θ)=i=1K(akn1keαk+β1+eαk+β)=i=1K(akn1kπ1k)

ヘッセ行列の成分の定義式より、 Hαk(θ)=αkUαk(θ)=n1k[eαk+β1+eαk+β(eαk+β1+eαk+β)2]n2k[eαk1+eαk(eαk1+eαk)2]=n1kπ1k(1π1k)n0kπ0k(1π0k) Hβ(θ)=βUβ(θ)=k=1Kn1k[eαk+β1+eαk+β(eαk+β1+eαk+β)2]=k=1K[n1kπ1k(1π1k)] Hαkβ(θ)=αkUβ(θ)=βUαk(θ)=n1k[eαk+β1+eαk+β(eαk+β1+eαk+β)2]=n1kπ1k(1π1k)

帰無仮説 H0:β=β0=0 のもとでの αk のスコア関数は、 Uαk(θ0)=m1kn1keαk1+eαkn0keαk1+eαk=m1k(n1k+n0k)eαk1+eαk=m1kNeαk1+eαk 最尤推定量の定義式 U(θ^)=0 より、 0=m1kNeα^k1+eα^keα^k1+eα^k=m1kNeα^k=m1kN(1+eα^k)(1m1kN)eα^k=m1kNeα^k=m1km0kα^k=logm1km0k 同様に、帰無仮説のもとでの β のスコア関数は、 Uβ(θ0)=i=1K(akn1keαk1+eαk) スコア方程式 U(θ^)=0 を求めると、 0=i=1K(akn1keα^k1+eα^k)0=i=1K(akn1km1km2k1+m1km2k)0=i=1K(akn1km1km2k+m1k)0=i=1K(akn1km1kN)

帰無仮説 H0:π1k=π0k=πk のもとでのヘッセ行列の成分は、 Hαk(θ0)=n1k[eαk1+eαk(eαk1+eαk)2]n0k[eαk1+eαk(eαk1+eαk)2]=Nk[eαk1+eαk(eαk1+eαk)2]=Nk[eαk1+eαk(eαk1+eαk)2]=Nkπk(1πk) Hβ(θ0)=k=1Kn1k[eαk1+eαk(eαk1+eαk)2]=k=1Kn1kπk(1πk) Hαkβ(θ0)=n1k[eαk1+eαk(eαk1+eαk)2]=n1kπk(1πk) 二項分布における期待情報行列 I(θ)=i(θ)=H(θ) の成分は、 Iαk(θ0)=Nk[eαk1+eαk(eαk1+eαk)2]=Nkπk(1πk)Iβ(θ0)=k=1Kn1k[eαk1+eαk(eαk1+eαk)2]=k=1Kn1kπk(1πk)Iαkβ(θ0)=n1k[eαk1+eαk(eαk1+eαk)2]=n1kπk(1πk) この最尤推定量は、α^k=logm1km0k を代入すると、 Iαk(θ0)=Nkm1kNk(1m1kNk)=m1km0kNkIβ(θ0)=k=1Kn1km1kNk(1m1kNk)=k=1Kn1km1km0kNkIαkβ(θ0)=n1km1kNk(1m1kNk)=n1km1km0kNk また、kl に対しては層が独立なため、 Iαk,αl(θ0)=0 したがって、推定情報行列の成分は、 I(θ^0)=[Iα(θ^0)Iαβ(θ^0)Iαβ(θ^0)TIβ(θ^0)] ただし、 Iα(θ^0)=diag{Iα1(θ^0)IαK(θ^0)} K×K 対角行列である。

逆行列 Iβ(θ^0)1 の必要となる成分は、 逆行列に関する公式を用いると、 Iβ(θ^0)1=1k=1KV^(ak)V^(β^)=k=1KV^(ak) 結果として有効スコア検定 χ2=β^2V^(β^) は、 χ2=[k=1K{akn1km1kNk}]2k=1K[n1kn0km1km0kNk3]=[k=1K[akE(ak|H0)]]2k=1KV^(ak)

これは、層別解析におけるコクラン検定と等しい。また、この検定の計算を行うために局外パラメータ {α^k} の推定値について解く必要はない。

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.279-282
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.298-300

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ