生存時間分布のパラメトリックモデル①:指数分布モデル

公開日:

【2022年12月1週】 【A000】生物統計学 【A051】コホート研究 【A100】生存時間分析 【A101】生存関数の推定

この記事をシェアする
  • B!
サムネイル画像

本稿では、生存時間分布のパラメトリックモデルのひとつである指数分布モデルについて重要事項をまとめています。このモデルは、ハザードが時間経過と共に変化しないことを仮定したモデルで、ある期間内におけるイベント発生回数に着目すると、二重同次ポアソンモデルとなるモデルです。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる(0に確率収束する)と仮定しています。

生存時間分布の指数分布モデル

ハザード関数が定数ハザード λ(t)=λ0<t となるモデルを 指数分布モデル exponential distribution model と呼ぶ。

生存関数、累積ハザード関数、累積分布関数、確率密度関数は、 H(t)=λtS(t)=eλtf(t)=λeλtF(t)=1eλt で与えられる。

【定理】パラメータの最尤推定量と漸近分散

【定理】
パラメータの最尤推定量と漸近分散
MLE and Asymptotic Variance

定数ハザード λ の最尤推定量とその漸近分散は、
〔1〕打ち切りがない場合 λ^=NTV(λ^)=λ2N 〔2〕打ち切りがある場合 λ^=di=1dti+i=d+1Nti+V(λ^)=λ2E(D)=λ2NE(δ) また、漸近的に、 λ^N[λ,λ2E(D)]

証明:パラメータの最尤推定量と漸近分散―打ち切りがない場合

証明

イベント時間の確率密度関数 f(t)=λ(t)S(t) は、 f(t)=λeλt 打ち切りが存在しないとき、尤度関数は、 L(λ)=i=1Nλeλti 対数尤度関数 l(θ,x)=logL(θ,x) は、 l(λ)=i=1N(logλλti)=Nlogλλi=1Nti パラメータ λ に関するスコア関数 U(λ)=λl(λ) は、 U(λ)=NλT 尤度方程式 U(θ)=0 を解くと、パラメータ λ の最尤推定量は、 Nλ^=Tλ^=NT 観測情報量 i(θ)=θU(θ) は、 i(λ)=(Nλ2)=Nλ2 期待情報量 I(θ)=E[i(θ)] は、 I(λ)=E[Nλ2]=Nλ2 したがって、パラメータ λ の最尤推定量の漸近分散 V(θ^)=1I(θ^)V(λ^)=λ2N

証明:パラメータの最尤推定量と漸近分散―打ち切りがある場合

証明

イベント時間の尤度は、 L(λ)=i=1N[f(ti)]δi[S(ti)]1δi イベント時間の確率密度関数、ハザード関数、生存関数の関係 f(t)=λ(t)S(t) より、 L(λ)=i=1N[λ(ti)S(ti)]δi[S(ti)]1δi=i=1N[λ(ti)]δiS(ti)=i=1Nλδieλti 対数尤度関数 l(θ,x)=logL(θ,x) は、 l(λ)=i=1N(δilogλλti)=logλi=1Nδiλi=1Nti=Dlogλλi=1Nti イベント時間と打ち切りの時間の関係は、 i=1Nti=i=1dti+i=d+1Nti+ よって、 l(λ)=Dlogλλ(i=1dti+i=d+1Nti+) パラメータ λ に関するスコア関数 U(λ)=θl(λ) は、 U(λ)=Dλ(i=1dti+i=d+1Nti+) 尤度方程式 U(θ)=0 を解くと、パラメータ λ の最尤推定量は、 Dλ^=(i=1dti+i=d+1Nti+)λ^=Di=1dti+i=d+1Nti+ 観測情報量 i(θ)=θU(θ) は、 i(λ)=(Dλ2)=Dλ2 期待情報量 I(θ)=E[i(θ)] は、E(D)=NE(δ) より、 I(λ)=E[Dλ2]=E(D)λ2=NE(δ)λ2 したがって、パラメータ λ の最尤推定量の漸近分散 V(θ^)=1I(θ^)V(λ^)=λ2NE(δ) 最尤推定量の漸近的性質より、 λ^N[λ,λ2E(D)]

【定理】推定(対数)生存関数の漸近分布

【定理】
(対数)生存関数の漸近分布
Asymptotic Distribution of (Log) Survival Function

ランダム打ち切りのもと、与えられた時間 t における生存関数をパラメータの最尤推定量 λ^ で推定するとき、漸近的に
〔1〕対数生存関数 logS^(t)N[λt,(λt)2E(D)] 〔2〕生存関数 S^(t)N[eλt,e2λt(λt)2E(D)]

証明:対数生存関数の漸近分布

証明

ここで、 g(λ)=logS(t)=λtg(λ^)=logS^(t)=λ^t と変数変換する。 デルタ法を用いて、g(λ^) を期待値 E(λ^)=λ まわりでテイラー展開すると、g(λ^) の1階微分は、 g(λ^)=t よって、デルタ法における期待値と分散の公式より、 E{g(λ^)}E[g(λ)]=λt V[g(λ^)]{g(λ)}2V(λ^)=(t)2λ2E(D)=(λt)2E(D) したがって、スラツキーの定理より、 logS^(t)dN[λt,(λt)2E(D)]

[別解]この変数変換の場合は、単純な線形変換なので、線形変換の性質より、 E(λ^t)=tE(λ^)=λt V(λ^t)=(t)2V(λ^)=(λt)2E(D) したがって、 logS^(t)dN[λt,(λt)2E(D)]

証明:生存関数の漸近分布

証明

ここで、 g(λ)=S(t)=eλtg(λ^)=S^(t)=eλ^t と変数変換する。 デルタ法を用いて、g(λ^) を期待値 E(λ^)=λ まわりでテイラー展開すると、g(λ^) の1階微分は、 g(λ^)=teλt よって、デルタ法における期待値と分散の公式より、 E{g(λ^)}E[g(λ)]=eλt V[g(λ^)]{g(λ)}2V(λ^)=(teλt)2λ2E(D)=e2λt(λt)2E(D) したがって、スラツキーの定理より、 S^(t)dN[eλt,e2λt(λt)2E(D)]

【定理】2つの群の生存関数・生存時間の関係

【定理】
2つの群の生存関数・生存時間の関係
Relationship between Survival Functions (Life Time)

ハザード関数と生存関数がそれぞれ λi(t)=λiSi(t)=eλiti=1,20<t である2つの母集団について、 ハザードの比例定数を θ=λ1λ2 とするとき、 〔1〕生存関数の関係 S1(t)=[S2(t)]θ 〔2〕生存時間の関係 tiαi 番目の母集団内で生存者の割合が α である時点、すなわち、 Si(tiα)=α0<α<1i=1,2 とするとき、 t1αt2α=1θ

証明:2つの群の生存関数の関係

証明

生存関数の定義式を変形すると、 Si(t)=eλitλi=logSi(t)t これをハザードの比例定数の式 θ=λ1λ2 に代入すると、 θlogS2(t)t=logS1(t)tθlogS2(t)=logS1(t) 両辺の指数を取ると、 S1(t)=[S2(t)]θ

証明:2つの群の生存時間の関係

証明

t1α,t2α をハザードの比例定数の式 θ=λ1λ2 に代入すると、 θlogS2(t2α)t2α=logS1(t1α)t1αθlogαt2α=logαt1αt1αt2α=1θ

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.522-523, p.554-556

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ