ジョン・ラチン（2020）『医薬データのための統計解析』問題9.8 解答例-あるノマドの知の旅路～数学・統計学への道

本稿は、ジョン・ラチン（2020）『医薬データのための統計解析』の「問題9.8」の自作解答例です。カプラン・マイヤー法に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
曝露（発症）状況を表す右下の添え字は、「0」である場合（$n_0,\pi_0$ など）や「2」である場合（$n_2,\pi_2$ など）がありますが、どちらも「非曝露群（コントロール群）」を表しています。
漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
デルタ法を用いる際、剰余項（2次の項）が漸近的に無視できる（$0$に確率収束する）と仮定しています。
上述の参考書では、標準正規分布の上側 $100\alpha\%$ 点を $Z_{1-\alpha}$ と表記していますが、本サイトでは、$Z_\alpha$ としています。そのため、参考書に載っている式の形式と異なる部分があります。
著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題9.8.1：任意のイベント時間におけるイベント確率と生存関数の関係

被験者が時点 $t_{ \left(j\right)}$ を超えてイベントを発生せずに生存するためには $t_{ \left(j-1\right)}$ を超えてイベントを発生せずに生存する必要があり、以下、同様に、その前の時点での生存が条件となる。したがって、 \begin{align} S \left\{t_{ \left(j\right)}\right\}&=P \left\{t_{ \left(j\right)} \lt T\right\}\\ &=P \left\{t_{ \left(j\right)} \lt T\middle| t_{ \left(j-1\right)} \lt T\right\} \cdot P \left\{t_{ \left(j-1\right)} \lt T\right\}\\ &=P \left\{t_{ \left(j\right)} \lt T\middle| t_{ \left(j-1\right)} \lt T\right\} \cdot P \left\{t_{ \left(j-1\right)} \lt T\middle| t_{ \left(j-2\right)} \lt T\right\} \cdot P \left\{t_{ \left(j-2\right)} \lt T\right\}\\ &= \cdots \end{align} 定義より、 \begin{align} P \left\{t_{ \left(j\right)} \lt T\middle| t_{ \left(j-1\right)} \lt T\right\}&=P \left\{t_{ \left(j\right)} \lt T\middle| t_{ \left(j\right)} \le T\right\}\\ &=1-\pi_j \end{align} すなわち、 \begin{align} S \left\{t_{ \left(j\right)}\right\}&= \left(1-\pi_j\right)S \left\{t_{ \left(j-1\right)}\right\}\\ &= \left(1-\pi_j\right) \left(1-\pi_{j-1}\right) \cdots \left(1-\pi_2\right) \left(1-\pi_1\right)\\ &=\prod_{l=1}^{j} \left(1-\pi_l\right) \end{align} いっぽう、イベントの分布関数の定義より、 \begin{gather} F \left\{t_{ \left(j\right)}\right\}=\sum_{l=1}^{j}f_l\\ S \left\{t_{ \left(j\right)}\right\}=1-F \left\{t_{ \left(j\right)}\right\}=1-\sum_{l=1}^{j}f_l \end{gather} したがって、 \begin{align} S \left\{t_{ \left(j\right)}\right\}=\prod_{l=1}^{j} \left(1-\pi_l\right)=1-\sum_{l=1}^{j}f_l \end{align} また、 \begin{align} 1-\pi_j&=1-\frac{f_j}{\sum_{l=1}^{j}f_l}\\ &=\frac{\sum_{l=1}^{j}f_l-f_j}{\sum_{l=1}^{j}f_l}\\ &=\frac{\sum_{l=1}^{j-1}f_l}{\sum_{l=1}^{j}f_l} \end{align} \begin{align} S \left\{t_{ \left(j\right)}\right\}&=\prod_{l=1}^{j} \left(1-\pi_l\right)\\ &=\frac{f_1}{f_1+f_2} \cdot \frac{f_1+f_2}{f_1+f_2+f_3} \cdot \cdots \cdot \frac{f_1+f_2+ \cdots +f_{j-2}}{f_1+f_2+ \cdots +f_{j-1}} \cdot \frac{f_1+f_2+ \cdots +f_{j-1}}{f_1+f_2+ \cdots +f_j}\\ &=\frac{f_1}{\sum_{l=1}^{j}f_l} \end{align} $\blacksquare$

問題9.8.2：カプラン・マイヤー法の尤度関数

このとき尤度関数は、 \begin{align} L \left(\pi_1,\pi_2, \cdots ,\pi_J\right)\propto\prod_{j=1}^{J}{\pi_j^{d_j} \left[S \left\{t_{ \left(j-1\right)}\right\}\right]^{d_j} \left[S \left\{t_{ \left(j\right)}\right\}\right]^{w_j}} \end{align} ここで、以下のようにおくと、 \begin{align} M&=\prod_{j=1}^{J}{ \left[S \left\{t_{ \left(j-1\right)}\right\}\right]^{d_j} \left[S \left\{t_{ \left(j\right)}\right\}\right]^{w_j}}\\ &= \left[S \left\{t_{ \left(0\right)}\right\}\right]^{d_1} \left[S \left\{t_{ \left(1\right)}\right\}\right]^{w_1} \cdot \left[S \left\{t_{ \left(1\right)}\right\}\right]^{d_2} \left[S \left\{t_{ \left(2\right)}\right\}\right]^{w_2} \cdot \cdots \cdot \left[S \left\{t_{ \left(J-1\right)}\right\}\right]^{d_J} \left[S \left\{t_{ \left(J\right)}\right\}\right]^{w_J}\\ &= \left[S \left\{t_{ \left(0\right)}\right\}\right]^{d_1} \left[ \left(1-\pi_1\right)S \left\{t_{ \left(0\right)}\right\}\right]^{w_1} \cdots \left[S \left\{t_{ \left(J-1\right)}\right\}\right]^{d_J} \left[ \left(1-\pi_J\right)S \left\{t_{ \left(J-1\right)}\right\}\right]^{w_J}\\ &= \left[ \left(1-\pi_1\right)\right]^{w_1} \cdot \left[ \left(1-\pi_1\right)\right]^{d_2} \left[ \left(1-\pi_2\right) \left(1-\pi_1\right)\right]^{w_2} \cdots \left[ \left(1-\pi_{J-1}\right) \cdots \left(1-\pi_1\right)\right]^{d_J} \left[ \left(1-\pi_J\right) \cdots \left(1-\pi_1\right)\right]^{w_J}\\ &= \left(1-\pi_1\right)^{w_1+d_2+w_2+ \cdots +d_J+w_J} \cdot \left(1-\pi_2\right)^{w_2+d_3+w_3 \cdots +d_J+w_J} \cdots \left(1-\pi_J\right)^{w_{J-1}+d_J+w_J} \end{align} ここで、リスク集合とイベント数、打ち切り数についての関係式より、 \begin{gather} n_1-n_2=d_1+w_1\\ n_2-n_3=d_2+w_2\\ \vdots\\ n_J-n_{J+1}=d_J+w_J \end{gather} この辺々の和を取ると、$n_{J+1}=0$ より、 \begin{gather} n_1-n_{J+1}=\sum_{j=1}^{J} \left(d_j+w_j\right)\\ n_1=\sum_{j=1}^{J} \left(d_j+w_j\right)\\ n_1-d_1=\sum_{j=1}^{J} \left(d_j+w_j\right)-d_1 \end{gather} 同様の操作（$i$ 番目のリスク集合以降の和を取る）をすることで、一般に \begin{align} n_i-d_i=\sum_{j=1}^{J} \left(d_j+w_j\right)-d_i \end{align} よって、 \begin{align} M&= \left(1-\pi_1\right)^{n_1-d_1} \cdot \left(1-\pi_2\right)^{n_2-d_2} \cdot \cdots \cdot \left(1-\pi_J\right)^{n_J-d_J}\\ &=\prod_{j=1}^{J} \left(1-\pi_j\right)^{n_j-d_j} \end{align} したがって、 \begin{align} L \left(\pi_1,\pi_2, \cdots ,\pi_J\right)\propto\prod_{j=1}^{J}{\pi_j^{d_j} \left(1-\pi_j\right)^{n_j-d_j}} \end{align} 対数尤度関数 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ は、 \begin{align} l \left(\pi_1,\pi_2, \cdots ,\pi_J\right)=\sum_{j=1}^{J} \left\{d_j\log{\pi_j}+ \left(n_j-d_j\right)\log{ \left(1-\pi_j\right)}\right\} \end{align} パラメータ $\pi_i$ に関するスコア関数 $U \left(\theta\right)=\frac{\partial}{\partial\theta}l \left(\theta\right)$ は、 \begin{align} U \left(\pi_j\right)=\frac{d_j}{\pi_j}-\frac{n_j-d_j}{1-\pi_j} \end{align} 尤度方程式 $U \left(\theta\right)=0$ を解くと、パラメータ $\pi_j$ に関する条件付き最尤推定量は、 \begin{gather} d_j \left(1-{\hat{\pi}}_j\right)- \left(n_j-d_j\right){\hat{\pi}}_j=0\\ d_j-d_j{\hat{\pi}}_j-n_j{\hat{\pi}}_j+d_j{\hat{\pi}}_j=0\\ n_j{\hat{\pi}}_j=d_j \end{gather} \begin{align} {\hat{\pi}}_j=p_j=\frac{d_j}{n_j} \quad 1-{\hat{\pi}}_j=q_j=\frac{n_j-d_j}{n_j} \end{align} したがって、生存関数の一般化最尤推定値は $0 \le t \le t_{ \left(J\right)}$ に対して \begin{align} \hat{S} \left(t\right)&=\prod_{j=1}^{J} \left(\frac{n_j-d_j}{n_j}\right)^{I \left[t_{ \left(j\right)} \le t\right]}\\ &=\prod_{j=1}^{J}q_j^{I \left[t_{ \left(j\right)} \le t\right]}\\ &=\prod_{j:t_{ \left(j\right)} \le t} q_j \end{align} $\blacksquare$

問題9.8.3：生命表のためのカプラン・マイヤー推定量

修正尤度関数は、 \begin{align} L \left(\pi_1,\pi_2, \cdots ,\pi_J\right)=\prod_{j=1}^{J}{\pi_j^{d_j} \left(1-\pi_j\right)^{0.5w_j} \left(1-\pi_j\right)^{r_{j+1}}} \end{align} 対数尤度関数 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ は、 \begin{align} l \left(\pi_1,\pi_2, \cdots ,\pi_J\right)&=\sum_{j=1}^{J} \left\{d_j\log{\pi_j}+ \left(0.5w_j+r_{j+1}\right)\log{ \left(1-\pi_j\right)}\right\}\\ &=\sum_{j=1}^{J} \left\{d_j\log{\pi_j}+ \left(r_j-d_j-0.5w_j\right)\log{ \left(1-\pi_j\right)}\right\} \end{align} パラメータ $\pi_j$ に関するスコア関数 $U \left(\theta\right)=\frac{\partial}{\partial\theta}l \left(\theta\right)$ は、 \begin{align} U \left(\pi_j\right)=\frac{d_j}{\pi_j}-\frac{r_j-d_j-0.5w_j}{1-\pi_j} \end{align} 尤度方程式 $U \left(\theta\right)=0$ を解くと、パラメータ $\pi_j$ に関する条件付き最尤推定量は、 \begin{gather} d_j \left(1-{\hat{\pi}}_j\right)- \left(r_j-d_j-0.5w_j\right){\hat{\pi}}_j=0\\ d_j-d_j{\hat{\pi}}_j- \left(r_j-0.5w_j\right){\hat{\pi}}_j+d_j{\hat{\pi}}_j=0\\ \left(r_j-0.5w_j\right){\hat{\pi}}_j=d_j \end{gather} \begin{gather} {\hat{\pi}}_j=p_j=\frac{d_j}{r_j-0.5w_j}\\ 1-{\hat{\pi}}_j=q_j=\frac{r_j-0.5w_j-d_j}{r_j-0.5w_j} \end{gather} $\blacksquare$

問題9.8.4：任意のイベント確率どうしの関係

\begin{gather} E \left(d_j\right)=n_j\pi_j \quad V \left(d_j\right)=n_j\pi_j \left(1-\pi_j\right)\\ E \left(p_j\right)=\pi_j \quad \ V \left(p_j\right)=\frac{\pi_j \left(1-\pi_j\right)}{n_j} \end{gather} 確率変数が独立なとき、共分散の性質より、 \begin{align} \mathrm{Cov} \left(p_l,p_k\right)=0 \end{align} このとき、標本比率のベクトル \begin{align} \boldsymbol{p}= \left(\begin{matrix}p_1\\p_2\\\vdots\\p_J\\\end{matrix}\right) \end{align} について、多変量の中心極限定理より、漸近的に \begin{gather} \boldsymbol{p} \sim \mathrm{\boldsymbol{N}_J} \left(\boldsymbol{\pi},\boldsymbol{\Sigma}\right)\\ \boldsymbol{\pi}= \left(\begin{matrix}\pi_1\\\pi_2\\\vdots\\\pi_J\\\end{matrix}\right)\\ \boldsymbol{\Sigma}= \left(\begin{matrix}\sigma_1^2&0& \cdots &0\\0&\sigma_2^2& \cdots &0\\\vdots&\vdots&\ddots&\vdots\\0&0& \cdots &\sigma_J^2\\\end{matrix}\right)\\ \sigma_j^2=\frac{\pi_j \left(1-\pi_j\right)}{n_j} \end{gather} $\blacksquare$

問題9.8.5：推定対数生存関数の分散

ここで、任意の時点 $j$ における対数生存関数について、 \begin{gather} G \left(\boldsymbol{\pi}\right)=\log{S \left(t\right)}=\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}\\ G \left(\boldsymbol{p}\right)=\log{\hat{S} \left(t\right)}=\sum_{l=1}^{j}\log{ \left(1-p_l\right)} \end{gather} と変数変換する。多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\theta}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_1}\\\vdots\\\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_j}\\\end{matrix}\right)= \left(\begin{matrix}-\frac{1}{1-\pi_1}\\\vdots\\-\frac{1}{1-\pi_j}\\\end{matrix}\right) \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[\log{\hat{S} \left(t\right)}\right]\cong\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)} \end{align} \begin{align} V \left[\log{\hat{S} \left(t\right)}\right]&= \left[\begin{matrix}-\frac{1}{1-\pi_1}& \cdots &-\frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}\sigma_1^2& \cdots &0\\\vdots&\ddots&\vdots\\0& \cdots &\sigma_j^2\\\end{matrix}\right] \left[\begin{matrix}-\frac{1}{1-\pi_1}\\\vdots\\-\frac{1}{1-\pi_j}\\\end{matrix}\right]\\ &= \left[\begin{matrix}-\frac{1}{1-\pi_1}& \cdots &-\frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}-\frac{\pi_1}{n_1}\\\vdots\\-\frac{\pi_j}{n_j}\\\end{matrix}\right]\\ &=\frac{\pi_1}{n_1 \left(1-\pi_1\right)}+ \cdots +\frac{\pi_j}{n_j \left(1-\pi_j\right)}\\ &=\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)} \end{align} この一致推定量は、${\hat{\pi}}_j=p_j$ を代入して、 \begin{align} \hat{V} \left[\log{\hat{S} \left(t\right)}\right]=\sum_{l=1}^{j}\frac{d_l}{n_l \left(1-d_l\right)} \end{align} したがって、漸近的に、 \begin{align} \log{\hat{S} \left(t\right)} \sim N \left[\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)},\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)}\right] \end{align} $\blacksquare$

問題9.8.6：Greenwoodの公式

ここで、任意のイベント時点 $j$ における生存関数について、 \begin{gather} G \left(\boldsymbol{\pi}\right)=S \left(t\right)=\prod_{l=1}^{j} \left(1-\pi_l\right)\\ G \left(\boldsymbol{p}\right)=\hat{S} \left(t\right)=\prod_{l=1}^{j} \left(1-p_l\right) \end{gather} と変数変換する。多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\theta}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_1}\\\vdots\\\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_j}\\\end{matrix}\right)= \left(\begin{matrix}-\prod_{l \neq 1} \left(1-\pi_l\right)\\\vdots\\-\prod_{l \neq j} \left(1-\pi_l\right)\\\end{matrix}\right) \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[\hat{S} \left(t\right)\right]\cong\prod_{l=1}^{j} \left(1-\pi_l\right) \end{align} \begin{align} V \left[\hat{S} \left(t\right)\right]&= \left[\begin{matrix}-\prod_{l \neq 1} \left(1-\pi_l\right)& \cdots &-\prod_{l \neq j} \left(1-\pi_l\right)\\\end{matrix}\right] \left[\begin{matrix}\sigma_1^2& \cdots &0\\\vdots&\ddots&\vdots\\0& \cdots &\sigma_j^2\\\end{matrix}\right] \left[\begin{matrix}-\prod_{l \neq 1} \left(1-\pi_l\right)\\\vdots\\-\prod_{l \neq j} \left(1-\pi_l\right)\\\end{matrix}\right]\\ &= \left[\begin{matrix}-\prod_{l \neq 1} \left(1-\pi_l\right)& \cdots &-\prod_{l \neq j} \left(1-\pi_l\right)\\\end{matrix}\right] \left[\begin{matrix}-\frac{\pi_1 \left(1-\pi_1\right)}{n_1}\prod_{l \neq 1} \left(1-\pi_l\right)\\\vdots\\-\frac{\pi_i \left(1-\pi_i\right)}{n_i}\prod_{l \neq j} \left(1-\pi_l\right)\\\end{matrix}\right]\\ &=\frac{\pi_1 \left(1-\pi_1\right)}{n_1} \left\{\prod_{l \neq 1} \left(1-\pi_l\right)\right\}^2+ \cdots +\frac{\pi_j \left(1-\pi_j\right)}{n_j} \left\{\prod_{l \neq j} \left(1-\pi_l\right)\right\}^2\\ &=\frac{\pi_1 \left(1-\pi_1\right)^2}{n_1 \left(1-\pi_1\right)} \left\{\prod_{l \neq 1} \left(1-\pi_l\right)\right\}^2+ \cdots +\frac{\pi_j \left(1-\pi_j\right)^2}{n_j \left(1-\pi_j\right)} \left\{\prod_{l \neq j} \left(1-\pi_l\right)\right\}^2\\ &=\frac{\pi_1}{n_1 \left(1-\pi_1\right)} \left\{\prod_{l=1}^{j} \left(1-\pi_l\right)\right\}^2+ \cdots +\frac{\pi_j}{n_j \left(1-\pi_j\right)} \left\{\prod_{l=1}^{j} \left(1-\pi_l\right)\right\}^2\\ &=\frac{\pi_1}{n_1 \left(1-\pi_1\right)} \left\{S \left(t\right)\right\}^2+ \cdots +\frac{\pi_j}{n_j \left(1-\pi_j\right)} \left\{S \left(t\right)\right\}^2\\ &= \left\{S \left(t\right)\right\}^2 \left\{\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)}\right\}\\ \end{align} この一致推定量は、$S \left(t\right)=\hat{S} \left(t\right),{\hat{\pi}}_j=p_j$ を代入して、 \begin{align} \hat{V} \left[\hat{S} \left(t\right)\right]= \left\{\hat{S} \left(t\right)\right\}^2 \left\{\sum_{l=1}^{j}\frac{d_l}{n_l \left(n_l-d_l\right)}\right\} \end{align} $\blacksquare$

問題9.8.7：補対数対数生存関数の分散

ここで、任意のイベント時点 $j$ における生存関数について、 \begin{gather} G \left(\boldsymbol{\pi}\right)=\log{ \left\{-\log{S \left(t\right)}\right\}}=\log{ \left\{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}\right\}}\\ G \left(\boldsymbol{p}\right)=\log{ \left\{-\log{\hat{S} \left(t\right)}\right\}}=\log{ \left\{\sum_{l=1}^{j}\log{ \left(1-p_l\right)}\right\}} \end{gather} と変数変換する。多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\theta}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_1}\\\vdots\\\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_j}\\\end{matrix}\right)= \left(\begin{matrix}\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_1}\\\vdots\\\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right) \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[\log{ \left\{-\log{\hat{S} \left(t\right)}\right\}}\right]\cong\log{ \left\{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}\right\}} \end{align} \begin{align} V \left[\log{ \left\{-\log{\hat{S} \left(t\right)}\right\}}\right]&= \left[\begin{matrix}\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_1}& \cdots &\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}\sigma_1^2& \cdots &0\\\vdots&\ddots&\vdots\\0& \cdots &\sigma_j^2\\\end{matrix}\right] \left[\begin{matrix}\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_1}\\\vdots\\\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right]\\ &= \left[\begin{matrix}\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_1}& \cdots &\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}\frac{\pi_1}{n_1} \cdot \frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}}\\\vdots\\\frac{\pi_j}{n_j} \cdot \frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}}\\\end{matrix}\right]\\ &= \left\{\frac{1}{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}}\right\}^2 \left\{\frac{\pi_1}{n_1 \left(1-\pi_1\right)}+ \cdots +\frac{\pi_j}{n_j \left(1-\pi_j\right)}\right\}\\ &= \left\{\frac{1}{\log{S \left(t\right)}}\right\}^2 \left\{\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)}\right\}\\ \end{align} この一致推定量は、$S \left(t\right)=\hat{S} \left(t\right),{\hat{\pi}}_j=p_j$ を代入して、 \begin{align} \hat{V} \left[\log{ \left\{-\log{\hat{S} \left(t\right)}\right\}}\right]= \left\{\frac{1}{\log{\hat{S} \left(t\right)}}\right\}^2 \left\{\sum_{l=1}^{j}\frac{d_l}{n_l \left(n_l-d_l\right)}\right\} \end{align} したがって、補対数対数生存関数の最尤推定量は、漸近的に \begin{align} \log{ \left\{-\log{\hat{S} \left(t\right)}\right\}} \sim \mathrm{N} \left[\log{ \left\{\sum_{l=1}^{j}\log{ \left(1-\pi_l\right)}\right\}}, \left\{\frac{1}{\log{S \left(t\right)}}\right\}^2 \left\{\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)}\right\}\right] \end{align} $\blacksquare$

問題9.8.8：生存関数の信頼区間

標準正規分布を用いた信頼区間の公式より、 \begin{gather} -Z_{0.5\alpha} \le Z \le Z_{0.5\alpha}\\ -Z_{0.5\alpha} \le \frac{\log{ \left\{-\log{\hat{S} \left(t\right)}\right\}}-\log{ \left\{-\log{S \left(t\right)}\right\}}}{\sigma} \le Z_{0.5\alpha}\\ -Z_{0.5\alpha} \cdot \sigma \le \log{ \left\{\frac{-\log{\hat{S} \left(t\right)}}{-\log{S \left(t\right)}}\right\}} \le Z_{0.5\alpha} \cdot \sigma \end{gather} \begin{gather} L=-Z_{0.5\alpha} \cdot \sigma\\ U=Z_{0.5\alpha} \cdot \sigma\\ \Lambda \left(t\right)=-\log{S \left(t\right)} \end{gather} とおいて、逆変換を行うと、 \begin{gather} e^L \le \frac{\hat{\Lambda} \left(t\right)}{\Lambda \left(t\right)} \le e^U\\ e^{-U} \le \frac{\Lambda \left(t\right)}{\hat{\Lambda} \left(t\right)} \le e^{-L}\\ \hat{\Lambda} \left(t\right) \cdot e^{-U} \le \Lambda \left(t\right) \le \hat{\Lambda} \left(t\right) \cdot e^{-L}\\ \hat{\Lambda} \left(t\right) \cdot e^{-U} \le -\log{S \left(t\right)} \le \hat{\Lambda} \left(t\right) \cdot e^{-L}\\ -\hat{\Lambda} \left(t\right) \cdot e^{-L} \le \log{S \left(t\right)} \le -\hat{\Lambda} \left(t\right) \cdot e^{-U}\\ \exp \left\{-\hat{\Lambda} \left(t\right) \cdot e^{-L}\right\} \le S \left(t\right) \le \exp \left\{-\hat{\Lambda} \left(t\right) \cdot e^{-U}\right\}\\ \exp \left\{e^{-L}\log{\hat{S} \left(t\right)}\right\} \le S \left(t\right) \le \exp \left\{e^{-U}\log{\hat{S} \left(t\right)}\right\}\\ \exp \left\{\log{ \left\{\hat{S} \left(t\right)\right\}^{\exp \left(-L\right)}}\right\} \le S \left(t\right) \le \exp \left\{\log{ \left\{\hat{S} \left(t\right)\right\}^{\exp \left(-U\right)}}\right\}\\ \left\{\hat{S} \left(t\right)\right\}^{\exp \left(-L\right)} \le S \left(t\right) \le \left\{\hat{S} \left(t\right)\right\}^{\exp \left(-U\right)}\\ \left\{\hat{S} \left(t\right)\right\}^{\exp \left(-Z_{0.5\alpha} \cdot \sigma\right)} \le S \left(t\right) \le \left\{\hat{S} \left(t\right)\right\}^{\exp \left(Z_{0.5\alpha} \cdot \sigma\right)} \end{gather} $\blacksquare$

問題9.8.9：生存関数のロジットの分散

ここで、任意のイベント時点 $i$ における生存関数について、 \begin{gather} G \left(\boldsymbol{\pi}\right)=\log{\frac{S \left(t\right)}{1-S \left(t\right)}}\\ G \left(\boldsymbol{p}\right)=\log{\frac{\hat{S} \left(t\right)}{1-\hat{S} \left(t\right)}} \end{gather} と変数変換する。多変量のデルタ法を用いて $G \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりでテイラー展開すると、 \begin{align} \frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_i}&=\frac{1-S \left(t\right)}{S \left(t\right)} \cdot \frac{1}{ \left\{1-S \left(t\right)\right\}^2} \cdot \left\{-\prod_{l \neq j} \left(1-\pi_l\right)\right\}\\ &=-\frac{1}{1-S \left(t\right)} \cdot \frac{ \left(1-\pi_1\right) \cdots \left(1-\pi_{j-1}\right) \left(1-\pi_{j+1}\right) \cdots \left(1-\pi_J\right)}{ \left(1-\pi_1\right) \cdots \left(1-\pi_{j-1}\right) \left(1-\pi_j\right) \left(1-\pi_{j+1}\right) \cdots \left(1-\pi_J\right)}=-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_j} \end{align} よって、偏導関数ベクトルは、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\theta}\right)= \left(\begin{matrix}\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_1}\\\vdots\\\frac{G \left(\boldsymbol{\theta}\right)}{\partial\pi_j}\\\end{matrix}\right)= \left(\begin{matrix}-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_1}\\\vdots\\-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right) \end{align} 多変量のデルタ法の期待値と分散の公式より、 \begin{align} E \left[\log{\frac{\hat{S} \left(t\right)}{1-\hat{S} \left(t\right)}}\right]\cong\log{\frac{S \left(t\right)}{1-S \left(t\right)}} \end{align} \begin{align} V \left[\log{\frac{\hat{S} \left(t\right)}{1-\hat{S} \left(t\right)}}\right]&= \left[\begin{matrix}-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_1}& \cdots &-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}\sigma_1^2& \cdots &0\\\vdots&\ddots&\vdots\\0& \cdots &\sigma_j^2\\\end{matrix}\right] \left[\begin{matrix}-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_1}\\\vdots\\-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right]\\ &= \left[\begin{matrix}-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_1}& \cdots &-\frac{1}{1-S \left(t\right)} \cdot \frac{1}{1-\pi_j}\\\end{matrix}\right] \left[\begin{matrix}-\frac{\pi_1}{n_1} \cdot \frac{1}{1-S \left(t\right)}\\\vdots\\-\frac{\pi_j}{n_j} \cdot \frac{1}{1-S \left(t\right)}\\\end{matrix}\right]\\ &= \left\{\frac{1}{1-S \left(t\right)}\right\}^2 \left\{\frac{\pi_1}{n_1 \left(1-\pi_1\right)}+ \cdots +\frac{\pi_j}{n_j \left(1-\pi_j\right)}\right\}\\ &= \left\{\frac{1}{1-S \left(t\right)}\right\}^2 \left\{\sum_{l=1}^{j}\frac{\pi_l}{n_l \left(1-\pi_l\right)}\right\} \end{align} この一致推定量は、$S \left(t\right)=\hat{S} \left(t\right),{\hat{\pi}}_j=p_j$ を代入して、 \begin{align} \hat{V} \left[\log{\frac{\hat{S} \left(t\right)}{1-\hat{S} \left(t\right)}}\right]= \left\{\frac{1}{1-\hat{S} \left(t\right)}\right\}^2 \left\{\sum_{l=1}^{j}\frac{d_l}{n_l \left(n_l-d_l\right)}\right\} \end{align} $\blacksquare$

問題9.8.10：Petersonの推定

累積ハザード関数と生存関数の関係 $\Lambda \left(t\right)=-\log{S \left(t\right)}$ より、 \begin{align} \hat{\Lambda} \left(t\right)=-\sum_{l=1}^{j}\log{ \left(1-p_l\right)} \end{align} 累積ハザード関数とハザード関数の関係より、 \begin{gather} \Lambda \left\{t_{ \left(l\right)}\right\}=\sum_{l=1}^{j}{\lambda \left\{t_{ \left(l\right)}\right\} \cdot \left\{t_{ \left(l\right)}-t_{ \left(l-1\right)}\right\}}\\ {\hat{\lambda}}_{\mathrm{KM},j}=\frac{-\log{ \left(1-p_j\right)}}{t_{ \left(j\right)}-t_{ \left(j-1\right)}} \end{gather} $\blacksquare$

問題9.8.11：カプラン・マイヤー推定量とネルソン・アーレン推定量の関係

$\log{ \left(1-\epsilon\right)}\cong-\epsilon$ より、 \begin{align} {\hat{\lambda}}_{\mathrm{KM},j}\cong\frac{- \left(-p_j\right)}{t_{ \left(j\right)}-t_{ \left(j-1\right)}}=\frac{p_j}{t_{ \left(j\right)}-t_{ \left(j-1\right)}} \end{align} \begin{align} {\hat{S}}_{\mathrm{NA}} \left\{t_{ \left(j\right)}\right\}&=\exp \left[-\sum_{l=1}^{j}p_l\right]\\ &=\prod_{l=1}^{j}e^{-p_l}\\ &=e^{-p_1} \cdot e^{-p_2} \cdot \cdots \cdot e^{-p_j} \end{align} ここで、$e^{-\varepsilon}\cong1-\varepsilon$ より、$\varepsilon=p_j$ として、 \begin{align} e^{-p_j}\cong1-p_j=\frac{n_j-d_j}{n_j} \end{align} したがって、 \begin{align} {\hat{S}}_{\mathrm{NA}} \left\{t_{ \left(j\right)}\right\}=\prod_{l=1}^{j}e^{-p_l}\cong\prod_{l=1}^{j} \left(\frac{n_j-d_j}{n_j}\right)={\hat{S}}_{\mathrm{KM}} \left\{t_{ \left(j\right)}\right\} \end{align} また、$0 \lt x \lt 1$ を満たす任意の $x$ に対して、$1-x \le e^{-x}$ が成り立つので、 \begin{align} {\hat{S}}_{\mathrm{KM}} \left\{t_{ \left(j\right)}\right\} \le {\hat{S}}_{\mathrm{NA}} \left\{t_{ \left(j\right)}\right\} \end{align} すなわち、ネルソン・アーレン推定値は、常にカプラン・マイヤー推定値以上の値を取る。 $\blacksquare$

参考文献

ジョン・ラチン著, 宮岡悦良監訳, 遠藤輝, 黒沢健, 下川朝有, 寒水孝司訳. 医薬データのための統計解析. 共立出版, 2020, p.564-566
ジョン・ラチン著, 宮岡悦良監訳, 遠藤輝, 黒沢健, 下川朝有, 寒水孝司訳. 医薬データのための統計解析. 共立出版, 2020, p.464-475
Kaplan, E.L. & Meier, P.. Nonparametric estimation from incomplete observations. Journal of the American Statistical Association. 1958;53(282):457-481, doi: https://doi.org/10.2307/2281868
Peterson, A.V.. Expressing the Kaplan-Meier Estimator as a Function of Empirical Subsurvival Functions. Journal of the American Statistical Association. 1977;72(360):854-858, doi: https://doi.org/10.2307/2286474
Aalen, O.. Nonparametric Inference for a Family of Counting Processes. The Annals of Statistics. 1978;6(4):701-726, doi: https://www.jstor.org/stable/2958850
Greenwood, M.. The natural duration of cancer. Reports on Public Health and Medical Subjects. 1926;33:1-26, doi: https://doi.org/10.1136/bmj.2.3320.266
Gill, R.D.. Censoring and Stochastic Integrals. Amsterdam, Mathematisch Centrum, 1980, 178p.
Nelson, W.. Theory and Applications of Hazard Plotting for Censored Failure Data. Technometrics. 1972;14(4):945-966, doi: https://doi.org/10.2307/1267144

生存関数の推定

ジョン・ラチン（2020）『医薬データのための統計解析』問題9.8 解答例

問題9.8.1：任意のイベント時間におけるイベント確率と生存関数の関係

問題9.8.2：カプラン・マイヤー法の尤度関数

問題9.8.3：生命表のためのカプラン・マイヤー推定量

問題9.8.4：任意のイベント確率どうしの関係

問題9.8.5：推定対数生存関数の分散

問題9.8.6：Greenwoodの公式

問題9.8.7：補対数対数生存関数の分散

問題9.8.8：生存関数の信頼区間

問題9.8.9：生存関数のロジットの分散

問題9.8.10：Petersonの推定

問題9.8.11：カプラン・マイヤー推定量とネルソン・アーレン推定量の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

ジョン・ラチン（2020）『医薬データのための統計解析』 問題9.8 解答例

問題9.8.1：任意のイベント時間におけるイベント確率と生存関数の関係

問題9.8.2：カプラン・マイヤー法の尤度関数

問題9.8.3：生命表のためのカプラン・マイヤー推定量

問題9.8.4：任意のイベント確率どうしの関係

問題9.8.5：推定対数生存関数の分散

問題9.8.6：Greenwoodの公式

問題9.8.7：補対数対数生存関数の分散

問題9.8.8：生存関数の信頼区間

問題9.8.9：生存関数のロジットの分散

問題9.8.10：Petersonの推定

問題9.8.11：カプラン・マイヤー推定量とネルソン・アーレン推定量の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ジョン・ラチン（2020）『医薬データのための統計解析』問題9.8 解答例

ブログアーカイブ