生存時間分布のパラメトリックモデル①：指数分布モデル-あるノマドの知の旅路～数学・統計学への道

本稿では、生存時間分布のパラメトリックモデルのひとつである指数分布モデルについて重要事項をまとめています。このモデルは、ハザードが時間経過と共に変化しないことを仮定したモデルで、ある期間内におけるイベント発生回数に着目すると、二重同次ポアソンモデルとなるモデルです。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
曝露（発症）状況を表す右下の添え字は、「0」である場合（$n_0,\pi_0$ など）や「2」である場合（$n_2,\pi_2$ など）がありますが、どちらも「非曝露群（コントロール群）」を表しています。
漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
デルタ法を用いる際、剰余項（2次の項）が漸近的に無視できる（$0$に確率収束する）と仮定しています。

生存時間分布の指数分布モデル

ハザード関数が定数ハザード \begin{align} \lambda \left(t\right)=\lambda \quad 0 \lt t \end{align} となるモデルを 指数分布モデル exponential distribution model と呼ぶ。

生存関数、累積ハザード関数、累積分布関数、確率密度関数は、 \begin{gather} H \left(t\right)=\lambda t\\ S \left(t\right)=e^{-\lambda t}\\ f \left(t\right)=\lambda e^{-\lambda t} \quad F \left(t\right)=1-e^{-\lambda t} \end{gather} で与えられる。

【定理】パラメータの最尤推定量と漸近分散

【定理】
パラメータの最尤推定量と漸近分散
MLE and Asymptotic Variance

定数ハザード $\lambda$ の最尤推定量とその漸近分散は、
〔1〕打ち切りがない場合 \begin{align} \hat{\lambda}=\frac{N}{T} \quad V \left(\hat{\lambda}\right)=\frac{\lambda^2}{N} \end{align} 〔2〕打ち切りがある場合 \begin{gather} \hat{\lambda}=\frac{d_{\bullet }}{\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+}\\ V \left(\hat{\lambda}\right)=\frac{\lambda^2}{E \left(D\right)}=\frac{\lambda^2}{NE \left(\delta\right)} \end{gather} また、漸近的に、 \begin{align} \hat{\lambda} \sim \mathrm{N} \left[\lambda,\frac{\lambda^2}{E \left(D\right)}\right] \end{align}

証明：パラメータの最尤推定量と漸近分散―打ち切りがない場合

証明

イベント時間の確率密度関数 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ は、 \begin{align} f \left(t\right)=\lambda e^{-\lambda t} \end{align} 打ち切りが存在しないとき、尤度関数は、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{N}{\lambda e^{-\lambda t_i}} \end{align} 対数尤度関数 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ は、 \begin{align} l \left(\lambda\right)&=\sum_{i=1}^{N} \left(\log{\lambda}-\lambda t_i\right)\\ &=N\log{\lambda}-\lambda\sum_{i=1}^{N}t_i \end{align} パラメータ $\lambda$ に関するスコア関数 $U \left(\lambda\right)=\frac{\partial}{\partial\lambda}l \left(\lambda\right)$ は、 \begin{align} U \left(\lambda\right)=\frac{N}{\lambda}-T \end{align} 尤度方程式 $U \left(\theta\right)=0$ を解くと、パラメータ $\lambda$ の最尤推定量は、 \begin{gather} \frac{N}{\hat{\lambda}}=T\\ \hat{\lambda}=\frac{N}{T} \end{gather} 観測情報量 $i \left(\theta\right)=-\frac{\partial}{\partial\theta}U \left(\theta\right)$ は、 \begin{align} i \left(\lambda\right)&=- \left(-\frac{N}{\lambda^2}\right)\\ &=\frac{N}{\lambda^2}\\ \end{align} 期待情報量 $I \left(\theta\right)=E \left[i \left(\theta\right)\right]$ は、 \begin{align} I \left(\lambda\right)=E \left[\frac{N}{\lambda^2}\right]=\frac{N}{\lambda^2} \end{align} したがって、パラメータ $\lambda$ の最尤推定量の漸近分散 $V \left(\hat{\theta}\right)=\frac{1}{I \left(\hat{\theta}\right)}$ は \begin{align} V \left(\hat{\lambda}\right)=\frac{\lambda^2}{N} \end{align} $\blacksquare$

証明：パラメータの最尤推定量と漸近分散―打ち切りがある場合

証明

イベント時間の尤度は、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{N}{ \left[f \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}} \end{align} イベント時間の確率密度関数、ハザード関数、生存関数の関係 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ より、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{N}{ \left[\lambda \left(t_i\right) \cdot S \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}}\\ &=\prod_{i=1}^{N}{ \left[\lambda \left(t_i\right)\right]^{\delta_i} \cdot S \left(t_i\right)}\\ &=\prod_{i=1}^{N}{\lambda^{\delta_i} \cdot e^{-\lambda t_i}} \end{align} 対数尤度関数 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ は、 \begin{align} l \left(\lambda\right)&=\sum_{i=1}^{N} \left(\delta_i\log{\lambda}-\lambda t_i\right)\\ &=\log{\lambda}\sum_{i=1}^{N}\delta_i-\lambda\sum_{i=1}^{N}t_i\\ &=D\log{\lambda}-\lambda\sum_{i=1}^{N}t_i \end{align} イベント時間と打ち切りの時間の関係は、 \begin{align} \sum_{i=1}^{N}t_i=\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+ \end{align} よって、 \begin{align} l \left(\lambda\right)=D\log{\lambda}-\lambda \left(\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+\right) \end{align} パラメータ $\lambda$ に関するスコア関数 $U \left(\lambda\right)=\frac{\partial}{\partial\theta}l \left(\lambda\right)$ は、 \begin{align} U \left(\lambda\right)=\frac{D}{\lambda}- \left(\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+\right) \end{align} 尤度方程式 $U \left(\theta\right)=0$ を解くと、パラメータ $\lambda$ の最尤推定量は、 \begin{gather} \frac{D}{\hat{\lambda}}= \left(\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+\right)\\ \hat{\lambda}=\frac{D}{\sum_{i=1}^{d_{\bullet }}t_i+\sum_{i=d_{\bullet }+1}^{N}t_i^+} \end{gather} 観測情報量 $i \left(\theta\right)=-\frac{\partial}{\partial\theta}U \left(\theta\right)$ は、 \begin{align} i \left(\lambda\right)&=- \left(-\frac{D}{\lambda^2}\right)\\ &=\frac{D}{\lambda^2} \end{align} 期待情報量 $I \left(\theta\right)=E \left[i \left(\theta\right)\right]$ は、$E \left(D\right)=NE \left(\delta\right)$ より、 \begin{align} I \left(\lambda\right)&=E \left[\frac{D}{\lambda^2}\right]\\ &=\frac{E \left(D\right)}{\lambda^2} &=\frac{NE \left(\delta\right)}{\lambda^2} \end{align} したがって、パラメータ $\lambda$ の最尤推定量の漸近分散 $V \left(\hat{\theta}\right)=\frac{1}{I \left(\hat{\theta}\right)}$ は \begin{align} V \left(\hat{\lambda}\right)=\frac{\lambda^2}{NE \left(\delta\right)} \end{align} 最尤推定量の漸近的性質より、 \begin{align} \hat{\lambda} \sim \mathrm{N} \left[\lambda,\frac{\lambda^2}{E \left(D\right)}\right] \end{align} $\blacksquare$

【定理】推定（対数）生存関数の漸近分布

【定理】
（対数）生存関数の漸近分布
Asymptotic Distribution of (Log) Survival Function

ランダム打ち切りのもと、与えられた時間 $t$ における生存関数をパラメータの最尤推定量 $\hat{\lambda}$ で推定するとき、漸近的に
〔1〕対数生存関数 \begin{align} \log{\hat{S} \left(t\right)} \sim \mathrm{N} \left[-\lambda t,\frac{ \left(\lambda t\right)^2}{E \left(D\right)}\right] \end{align} 〔2〕生存関数 \begin{align} \hat{S} \left(t\right) \sim \mathrm{N} \left[e^{-\lambda t},\frac{e^{-2\lambda t} \cdot \left(\lambda t\right)^2}{E \left(D\right)}\right] \end{align}

証明：対数生存関数の漸近分布

証明

ここで、 \begin{gather} g \left(\lambda\right)=\log{S \left(t\right)}=-\lambda t\\ g(\hat{\lambda})=\log{\hat{S} \left(t\right)}=-\hat{\lambda}t \end{gather} と変数変換する。デルタ法を用いて、$g(\hat{\lambda})$ を期待値 $E(\hat{\lambda})=\lambda$ まわりでテイラー展開すると、$g(\hat{\lambda})$ の1階微分は、 \begin{align} g^\prime(\hat{\lambda})=-t \end{align} よって、デルタ法における期待値と分散の公式より、 \begin{align} E \left\{g(\hat{\lambda})\right\}&\cong E \left[g \left(\lambda\right)\right]\\ &=-\lambda t\\ \end{align} \begin{align} V \left[g(\hat{\lambda})\right]&\cong \left\{g^\prime \left(\lambda\right)\right\}^2V(\hat{\lambda})\\ &= \left(-t\right)^2 \cdot \frac{\lambda^2}{E \left(D\right)}\\ &=\frac{ \left(\lambda t\right)^2}{E \left(D\right)} \end{align} したがって、スラツキーの定理より、 \begin{align} \log{\hat{S} \left(t\right)}\xrightarrow[]{d}\mathrm{N} \left[-\lambda t,\frac{ \left(\lambda t\right)^2}{E \left(D\right)}\right] \end{align}

［別解］この変数変換の場合は、単純な線形変換なので、線形変換の性質より、 \begin{align} E \left(-\hat{\lambda}t\right)&=-t \cdot E \left(\hat{\lambda}\right)\\ &=-\lambda t \end{align} \begin{align} V \left(-\hat{\lambda}t\right)&= \left(-t\right)^2 \cdot V \left(\hat{\lambda}\right)\\ &=\frac{ \left(\lambda t\right)^2}{E \left(D\right)} \end{align} したがって、 \begin{align} \log{\hat{S} \left(t\right)}\xrightarrow[]{d}\mathrm{N} \left[-\lambda t,\frac{ \left(\lambda t\right)^2}{E \left(D\right)}\right] \end{align} $\blacksquare$

証明：生存関数の漸近分布

証明

ここで、 \begin{gather} g \left(\lambda\right)=S \left(t\right)=e^{-\lambda t}\\ g(\hat{\lambda})=\hat{S} \left(t\right)=e^{-\hat{\lambda}t} \end{gather} と変数変換する。デルタ法を用いて、$g(\hat{\lambda})$ を期待値 $E(\hat{\lambda})=\lambda$ まわりでテイラー展開すると、$g(\hat{\lambda})$ の1階微分は、 \begin{align} g^\prime(\hat{\lambda})=-te^{-\lambda t} \end{align} よって、デルタ法における期待値と分散の公式より、 \begin{align} E \left\{g(\hat{\lambda})\right\}&\cong E \left[g \left(\lambda\right)\right]\\ &=e^{-\lambda t}\\ \end{align} \begin{align} V \left[g(\hat{\lambda})\right]&\cong \left\{g^\prime \left(\lambda\right)\right\}^2V(\hat{\lambda})\\ &= \left(-te^{-\lambda t}\right)^2 \cdot \frac{\lambda^2}{E \left(D\right)}\\ &=\frac{e^{-2\lambda t} \cdot \left(\lambda t\right)^2}{E \left(D\right)} \end{align} したがって、スラツキーの定理より、 \begin{align} \hat{S} \left(t\right)\xrightarrow[]{d}\mathrm{N} \left[e^{-\lambda t},\frac{e^{-2\lambda t} \cdot \left(\lambda t\right)^2}{E \left(D\right)}\right] \end{align} $\blacksquare$

【定理】2つの群の生存関数・生存時間の関係

【定理】
2つの群の生存関数・生存時間の関係
Relationship between Survival Functions (Life Time)

ハザード関数と生存関数がそれぞれ \begin{gather} \lambda_i \left(t\right)=\lambda_i \quad S_i \left(t\right)=e^{-\lambda_it}\\ i=1,2 \quad 0 \lt t \end{gather} である2つの母集団について、ハザードの比例定数を \begin{align} \theta=\frac{\lambda_1}{\lambda_2} \end{align} とするとき、〔1〕生存関数の関係 \begin{align} S_1 \left(t\right)= \left[S_2 \left(t\right)\right]^\theta \end{align} 〔2〕生存時間の関係 $t_{i\alpha}$ を $i$ 番目の母集団内で生存者の割合が $\alpha$ である時点、すなわち、 \begin{gather} S_i \left(t_{i\alpha}\right)=\alpha\\ 0 \lt \alpha \lt 1 \quad i=1,2 \end{gather} とするとき、 \begin{align} \frac{t_{1\alpha}}{t_{2\alpha}}=\frac{1}{\theta} \end{align}

証明：2つの群の生存関数の関係

証明

生存関数の定義式を変形すると、 \begin{align} S_i \left(t\right)=e^{-\lambda_it}\Leftrightarrow\lambda_i=\frac{\log{S_i \left(t\right)}}{t} \end{align} これをハザードの比例定数の式 $\theta=\frac{\lambda_1}{\lambda_2}$ に代入すると、 \begin{gather} \theta \cdot \frac{\log{S_2 \left(t\right)}}{t}=\frac{\log{S_1 \left(t\right)}}{t}\\ \theta \cdot \log{S_2 \left(t\right)}=\log{S_1 \left(t\right)} \end{gather} 両辺の指数を取ると、 \begin{align} S_1 \left(t\right)= \left[S_2 \left(t\right)\right]^\theta \end{align} $\blacksquare$

証明：2つの群の生存時間の関係

証明

$t_{1\alpha},t_{2\alpha}$ をハザードの比例定数の式 $\theta=\frac{\lambda_1}{\lambda_2}$ に代入すると、 \begin{gather} \theta \cdot \frac{\log{S_2 \left(t_{2\alpha}\right)}}{t_{2\alpha}}=\frac{\log{S_1 \left(t_{1\alpha}\right)}}{t_{1\alpha}}\\ \theta \cdot \frac{\log{\alpha}}{t_{2\alpha}}=\frac{\log{\alpha}}{t_{1\alpha}}\\ \frac{t_{1\alpha}}{t_{2\alpha}}=\frac{1}{\theta} \end{gather} $\blacksquare$

参考文献

ジョン・ラチン著, 宮岡悦良監訳, 遠藤輝, 黒沢健, 下川朝有, 寒水孝司訳. 医薬データのための統計解析. 共立出版, 2020, p.522-523, p.554-556

生存時間分布のパラメトリックモデル①：指数分布モデル

生存時間分布の指数分布モデル

【定理】パラメータの最尤推定量と漸近分散

証明：パラメータの最尤推定量と漸近分散―打ち切りがない場合

証明：パラメータの最尤推定量と漸近分散―打ち切りがある場合

【定理】推定（対数）生存関数の漸近分布

証明：対数生存関数の漸近分布

証明：生存関数の漸近分布

【定理】2つの群の生存関数・生存時間の関係

証明：2つの群の生存関数の関係

証明：2つの群の生存時間の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

生存時間分布のパラメトリックモデル①：指数分布モデル

生存時間分布の指数分布モデル

【定理】パラメータの最尤推定量と漸近分散

証明：パラメータの最尤推定量と漸近分散―打ち切りがない場合

証明：パラメータの最尤推定量と漸近分散―打ち切りがある場合

【定理】推定（対数）生存関数の漸近分布

証明：対数生存関数の漸近分布

証明：生存関数の漸近分布

【定理】2つの群の生存関数・生存時間の関係

証明：2つの群の生存関数の関係

証明：2つの群の生存時間の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ブログアーカイブ