ジョン・ラチン(2020)『医薬データのための統計解析』 問題9.8 解答例

公開日:

【2022年12月3週】 【A000】生物統計学 【A100】生存時間分析 【A101】生存関数の推定

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題9.8」の自作解答例です。カプラン・マイヤー法に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる(0に確率収束する)と仮定しています。
  • 上述の参考書では、標準正規分布の上側 100α% 点を Z1α と表記していますが、本サイトでは、Zα としています。そのため、参考書に載っている式の形式と異なる部分があります。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題9.8.1:任意のイベント時間におけるイベント確率と生存関数の関係

被験者が時点 t(j) を超えてイベントを発生せずに生存するためには t(j1) を超えてイベントを発生せずに生存する必要があり、以下、同様に、その前の時点での生存が条件となる。したがって、 S{t(j)}=P{t(j)<T}=P{t(j)<T|t(j1)<T}P{t(j1)<T}=P{t(j)<T|t(j1)<T}P{t(j1)<T|t(j2)<T}P{t(j2)<T}= 定義より、 P{t(j)<T|t(j1)<T}=P{t(j)<T|t(j)T}=1πj すなわち、 S{t(j)}=(1πj)S{t(j1)}=(1πj)(1πj1)(1π2)(1π1)=l=1j(1πl) いっぽう、イベントの分布関数の定義より、 F{t(j)}=l=1jflS{t(j)}=1F{t(j)}=1l=1jfl したがって、 S{t(j)}=l=1j(1πl)=1l=1jfl また、 1πj=1fjl=1jfl=l=1jflfjl=1jfl=l=1j1fll=1jfl S{t(j)}=l=1j(1πl)=f1f1+f2f1+f2f1+f2+f3f1+f2++fj2f1+f2++fj1f1+f2++fj1f1+f2++fj=f1l=1jfl

問題9.8.2:カプラン・マイヤー法の尤度関数

このとき尤度関数は、 L(π1,π2,,πJ)j=1Jπjdj[S{t(j1)}]dj[S{t(j)}]wj ここで、以下のようにおくと、 M=j=1J[S{t(j1)}]dj[S{t(j)}]wj=[S{t(0)}]d1[S{t(1)}]w1[S{t(1)}]d2[S{t(2)}]w2[S{t(J1)}]dJ[S{t(J)}]wJ=[S{t(0)}]d1[(1π1)S{t(0)}]w1[S{t(J1)}]dJ[(1πJ)S{t(J1)}]wJ=[(1π1)]w1[(1π1)]d2[(1π2)(1π1)]w2[(1πJ1)(1π1)]dJ[(1πJ)(1π1)]wJ=(1π1)w1+d2+w2++dJ+wJ(1π2)w2+d3+w3+dJ+wJ(1πJ)wJ1+dJ+wJ ここで、リスク集合とイベント数、打ち切り数についての関係式より、 n1n2=d1+w1n2n3=d2+w2nJnJ+1=dJ+wJ この辺々の和を取ると、nJ+1=0 より、 n1nJ+1=j=1J(dj+wj)n1=j=1J(dj+wj)n1d1=j=1J(dj+wj)d1 同様の操作(i 番目のリスク集合以降の和を取る)をすることで、一般に nidi=j=1J(dj+wj)di よって、 M=(1π1)n1d1(1π2)n2d2(1πJ)nJdJ=j=1J(1πj)njdj したがって、 L(π1,π2,,πJ)j=1Jπjdj(1πj)njdj 対数尤度関数 l(θ,x)=logL(θ,x) は、 l(π1,π2,,πJ)=j=1J{djlogπj+(njdj)log(1πj)} パラメータ πi に関するスコア関数 U(θ)=θl(θ) は、 U(πj)=djπjnjdj1πj 尤度方程式 U(θ)=0 を解くと、パラメータ πj に関する条件付き最尤推定量は、 dj(1π^j)(njdj)π^j=0djdjπ^jnjπ^j+djπ^j=0njπ^j=dj π^j=pj=djnj1π^j=qj=njdjnj したがって、生存関数の一般化最尤推定値は 0tt(J) に対して S^(t)=j=1J(njdjnj)I[t(j)t]=j=1JqjI[t(j)t]=j:t(j)tqj

問題9.8.3:生命表のためのカプラン・マイヤー推定量

修正尤度関数は、 L(π1,π2,,πJ)=j=1Jπjdj(1πj)0.5wj(1πj)rj+1 対数尤度関数 l(θ,x)=logL(θ,x) は、 l(π1,π2,,πJ)=j=1J{djlogπj+(0.5wj+rj+1)log(1πj)}=j=1J{djlogπj+(rjdj0.5wj)log(1πj)} パラメータ πj に関するスコア関数 U(θ)=θl(θ) は、 U(πj)=djπjrjdj0.5wj1πj 尤度方程式 U(θ)=0 を解くと、パラメータ πj に関する条件付き最尤推定量は、 dj(1π^j)(rjdj0.5wj)π^j=0djdjπ^j(rj0.5wj)π^j+djπ^j=0(rj0.5wj)π^j=dj π^j=pj=djrj0.5wj1π^j=qj=rj0.5wjdjrj0.5wj

問題9.8.4:任意のイベント確率どうしの関係

E(dj)=njπjV(dj)=njπj(1πj)E(pj)=πj V(pj)=πj(1πj)nj 確率変数が独立なとき、共分散の性質より、 Cov(pl,pk)=0 このとき、標本比率のベクトル p=(p1p2pJ) について、 多変量の中心極限定理より、漸近的に pNJ(π,Σ)π=(π1π2πJ)Σ=(σ12000σ22000σJ2)σj2=πj(1πj)nj

問題9.8.5:推定対数生存関数の分散

ここで、任意の時点 j における対数生存関数について、 G(π)=logS(t)=l=1jlog(1πl)G(p)=logS^(t)=l=1jlog(1pl) と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、偏導関数ベクトルは、 H(θ)=(G(θ)π1G(θ)πj)=(11π111πj) 多変量のデルタ法の期待値と分散の公式より、 E[logS^(t)]l=1jlog(1πl) V[logS^(t)]=[11π111πj][σ1200σj2][11π111πj]=[11π111πj][π1n1πjnj]=π1n1(1π1)++πjnj(1πj)=l=1jπlnl(1πl) この一致推定量は、π^j=pj を代入して、 V^[logS^(t)]=l=1jdlnl(1dl) したがって、漸近的に、 logS^(t)N[l=1jlog(1πl),l=1jπlnl(1πl)]

問題9.8.6:Greenwoodの公式

ここで、任意のイベント時点 j における生存関数について、 G(π)=S(t)=l=1j(1πl)G(p)=S^(t)=l=1j(1pl) と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、偏導関数ベクトルは、 H(θ)=(G(θ)π1G(θ)πj)=(l1(1πl)lj(1πl)) 多変量のデルタ法の期待値と分散の公式より、 E[S^(t)]l=1j(1πl) V[S^(t)]=[l1(1πl)lj(1πl)][σ1200σj2][l1(1πl)lj(1πl)]=[l1(1πl)lj(1πl)][π1(1π1)n1l1(1πl)πi(1πi)nilj(1πl)]=π1(1π1)n1{l1(1πl)}2++πj(1πj)nj{lj(1πl)}2=π1(1π1)2n1(1π1){l1(1πl)}2++πj(1πj)2nj(1πj){lj(1πl)}2=π1n1(1π1){l=1j(1πl)}2++πjnj(1πj){l=1j(1πl)}2=π1n1(1π1){S(t)}2++πjnj(1πj){S(t)}2={S(t)}2{l=1jπlnl(1πl)} この一致推定量は、S(t)=S^(t),π^j=pj を代入して、 V^[S^(t)]={S^(t)}2{l=1jdlnl(nldl)}

問題9.8.7:補対数対数生存関数の分散

ここで、任意のイベント時点 j における生存関数について、 G(π)=log{logS(t)}=log{l=1jlog(1πl)}G(p)=log{logS^(t)}=log{l=1jlog(1pl)} と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、偏導関数ベクトルは、 H(θ)=(G(θ)π1G(θ)πj)=(1l=1jlog(1πl)11π11l=1jlog(1πl)11πj) 多変量のデルタ法の期待値と分散の公式より、 E[log{logS^(t)}]log{l=1jlog(1πl)} V[log{logS^(t)}]=[1l=1jlog(1πl)11π11l=1jlog(1πl)11πj][σ1200σj2][1l=1jlog(1πl)11π11l=1jlog(1πl)11πj]=[1l=1jlog(1πl)11π11l=1jlog(1πl)11πj][π1n11l=1jlog(1πl)πjnj1l=1jlog(1πl)]={1l=1jlog(1πl)}2{π1n1(1π1)++πjnj(1πj)}={1logS(t)}2{l=1jπlnl(1πl)} この一致推定量は、S(t)=S^(t),π^j=pj を代入して、 V^[log{logS^(t)}]={1logS^(t)}2{l=1jdlnl(nldl)} したがって、補対数対数生存関数の最尤推定量は、漸近的に log{logS^(t)}N[log{l=1jlog(1πl)},{1logS(t)}2{l=1jπlnl(1πl)}]

問題9.8.8:生存関数の信頼区間

標準正規分布を用いた信頼区間の公式より、 Z0.5αZZ0.5αZ0.5αlog{logS^(t)}log{logS(t)}σZ0.5αZ0.5ασlog{logS^(t)logS(t)}Z0.5ασ L=Z0.5ασU=Z0.5ασΛ(t)=logS(t) とおいて、 逆変換を行うと、 eLΛ^(t)Λ(t)eUeUΛ(t)Λ^(t)eLΛ^(t)eUΛ(t)Λ^(t)eLΛ^(t)eUlogS(t)Λ^(t)eLΛ^(t)eLlogS(t)Λ^(t)eUexp{Λ^(t)eL}S(t)exp{Λ^(t)eU}exp{eLlogS^(t)}S(t)exp{eUlogS^(t)}exp{log{S^(t)}exp(L)}S(t)exp{log{S^(t)}exp(U)}{S^(t)}exp(L)S(t){S^(t)}exp(U){S^(t)}exp(Z0.5ασ)S(t){S^(t)}exp(Z0.5ασ)

問題9.8.9:生存関数のロジットの分散

ここで、任意のイベント時点 i における生存関数について、 G(π)=logS(t)1S(t)G(p)=logS^(t)1S^(t) と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、 G(θ)πi=1S(t)S(t)1{1S(t)}2{lj(1πl)}=11S(t)(1π1)(1πj1)(1πj+1)(1πJ)(1π1)(1πj1)(1πj)(1πj+1)(1πJ)=11S(t)11πj よって、偏導関数ベクトルは、 H(θ)=(G(θ)π1G(θ)πj)=(11S(t)11π111S(t)11πj) 多変量のデルタ法の期待値と分散の公式より、 E[logS^(t)1S^(t)]logS(t)1S(t) V[logS^(t)1S^(t)]=[11S(t)11π111S(t)11πj][σ1200σj2][11S(t)11π111S(t)11πj]=[11S(t)11π111S(t)11πj][π1n111S(t)πjnj11S(t)]={11S(t)}2{π1n1(1π1)++πjnj(1πj)}={11S(t)}2{l=1jπlnl(1πl)} この一致推定量は、S(t)=S^(t),π^j=pj を代入して、 V^[logS^(t)1S^(t)]={11S^(t)}2{l=1jdlnl(nldl)}

問題9.8.10:Petersonの推定

累積ハザード関数と生存関数の関係 Λ(t)=logS(t) より、 Λ^(t)=l=1jlog(1pl) 累積ハザード関数とハザード関数の関係より、 Λ{t(l)}=l=1jλ{t(l)}{t(l)t(l1)}λ^KM,j=log(1pj)t(j)t(j1)

問題9.8.11:カプラン・マイヤー推定量とネルソン・アーレン推定量の関係

log(1ϵ)ϵ より、 λ^KM,j(pj)t(j)t(j1)=pjt(j)t(j1) S^NA{t(j)}=exp[l=1jpl]=l=1jepl=ep1ep2epj ここで、eε1ε より、ε=pj として、 epj1pj=njdjnj したがって、 S^NA{t(j)}=l=1jepll=1j(njdjnj)=S^KM{t(j)} また、0<x<1 を満たす任意の x に対して、1xex が成り立つので、 S^KM{t(j)}S^NA{t(j)} すなわち、ネルソン・アーレン推定値は、常にカプラン・マイヤー推定値以上の値を取る。

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.564-566
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.464-475
  • Kaplan, E.L. & Meier, P.. Nonparametric estimation from incomplete observations. Journal of the American Statistical Association. 1958;53(282):457-481, doi: https://doi.org/10.2307/2281868
  • Peterson, A.V.. Expressing the Kaplan-Meier Estimator as a Function of Empirical Subsurvival Functions. Journal of the American Statistical Association. 1977;72(360):854-858, doi: https://doi.org/10.2307/2286474
  • Aalen, O.. Nonparametric Inference for a Family of Counting Processes. The Annals of Statistics. 1978;6(4):701-726, doi: https://www.jstor.org/stable/2958850
  • Greenwood, M.. The natural duration of cancer. Reports on Public Health and Medical Subjects. 1926;33:1-26, doi: https://doi.org/10.1136/bmj.2.3320.266
  • Gill, R.D.. Censoring and Stochastic Integrals. Amsterdam, Mathematisch Centrum, 1980, 178p.
  • Nelson, W.. Theory and Applications of Hazard Plotting for Censored Failure Data. Technometrics. 1972;14(4):945-966, doi: https://doi.org/10.2307/1267144

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ