統計検定 1級 2019年 医薬生物学 問1 生存時間分析:境界内平均生存時間

公開日: 更新日:

【2023年1月5週】 【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2019年に実施された統計検定1級『医薬生物学』 問1の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕カプラン・マイヤー法による生存関数の推定

与えられたデータにもとづいて表2を作成すると、以下のようになる。

表2 カプラン・マイヤー法による生存関数表
生存時間(週) $n_j$ $d_j$ $\hat{S} \left(t\right)$
$10$ $5$ $1$ $\frac{4}{5}$
$13$ $4$ $1$ $\frac{4}{5}\times\frac{3}{4}=\frac{3}{5}$
$19$ $2$ $1$ $\frac{3}{5}\times\frac{1}{2}=\frac{3}{10}$

これをもとにカプラン・マイヤー法による生存曲線を描くと、以下のようになる。

カプラン・マイヤー法による生存関数のグラフ
図1 カプラン・マイヤー法による生存関数
$\blacksquare$

〔2〕カプラン・マイヤー推定値とネルソン・アーレン推定値の関係

時点 $t$ におけるカプラン・マイヤー法により推定された生存関数の推定値 $\hat{S} \left(t\right)$ は、 \begin{align} \hat{S} \left(t\right)=\prod_{k=1}^{j} \left(1-\frac{d_k}{n_k}\right) \end{align} いっぽう、生存関数のネルソン・アーレン推定値は、 \begin{align} \widetilde{S} \left(t\right)=\prod_{k=1}^{j}{\mathrm{exp} \left(-\frac{d_k}{n_k}\right)} \end{align} ここで、以下のような関数を考えると、 \begin{gather} f \left(x\right)=e^{-x}- \left(1-x\right)\\ x=\frac{d_k}{n_k} \end{gather} $f \left(x\right)$ の1次導関数 $f^\prime \left(x\right)$ は、 \begin{align} f^\prime \left(x\right)=1--e^{-x} \end{align} 増減表は、 \begin{array}{c|cccc} x & \cdots & 0 & \cdots \\ \hline f^\prime \left(x\right) & - & 0 & + \\ \hline f \left(x\right) & \searrow & 0 & \nearrow \\ \end{array} したがって、$0 \le x$ となる任意の点において、 \begin{align} e^{-x} \geq 1-x \end{align} これにより、 \begin{gather} \mathrm{exp} \left(-\frac{d_k}{n_k}\right) \geq 1-\frac{d_k}{n_k}\\ \prod_{k=1}^{j}{\mathrm{exp} \left(-\frac{d_k}{n_k}\right)} \geq \prod_{k=1}^{j} \left(1-\frac{d_k}{n_k}\right)\\ \widetilde{S} \left(t\right) \geq \hat{S} \left(t\right) \end{gather} $\blacksquare$

〔3〕境界内平均生存時間の性質

$T$ の確率密度関数、累積分布関数、生存関数をそれぞれ以下のようにおく。 \begin{align} f \left(t\right) \quad F \left(t\right) \quad S \left(t\right) \end{align} 期待値の定義式 $E \left(X\right)=\int_{-\infty}^{\infty}{x \cdot f \left(x\right)dx}$ より、 \begin{align} E \left\{X \left(\tau\right)\right\}&=E \left\{\mathrm{min} \left(T,\tau\right)\right\}\\ &=\int_{0}^{\tau}{t \cdot f \left(t\right)dt}+\int_{\tau}^{\infty}{\tau \cdot f \left(t\right)dt}\\ &= \left[t \cdot F \left(t\right)\right]_0^\tau-\int_{0}^{\tau}F \left(t\right)dt+{\tau \left[F \left(t\right)\right]}_\tau^\infty\\ &=\tau F \left(\tau\right)-\int_{0}^{\tau} \left\{1-S \left(t\right)\right\}dt+\tau \left\{1-F \left(\tau\right)\right\}\\ &= \left[-t\right]_0^\tau+\int_{0}^{\tau}S \left(t\right)dt+\tau\\ &=-\tau+\int_{0}^{\tau}S \left(t\right)dt+\tau\\ &=\int_{0}^{\tau}S \left(t\right)dt \end{align} 以上より、境界内平均生存時問は、境界時間 $\tau$ 内における生存曲線の曲線下面積に等しい。 $\blacksquare$

〔4〕境界内平均生存時間の分散

〔3〕の結果に生存関数 $S \left(t\right)=e^{-\lambda t}$ を代入すると、 \begin{align} E \left\{X \left(\tau\right)\right\}&=\int_{0}^{\tau}S \left(t\right)dt\\ &=\int_{0}^{\tau}{e^{-\lambda t}dt}\\ &= \left[-\frac{1}{\lambda}e^{-\lambda t}\right]_0^\tau\\ &=\frac{1-e^{-\lambda\tau}}{\lambda} \end{align} 2乗の期待値の定義式 $E \left(X^2\right)=\int_{-\infty}^{\infty}{x^2 \cdot f \left(x\right)dx}$ より、 \begin{align} E \left\{X^2 \left(\tau\right)\right\}&=\int_{0}^{\tau}{t^2 \cdot f \left(t\right)dt}+\int_{\tau}^{\infty}{\tau^2 \cdot f \left(t\right)dt}\\ &= \left[t^2F \left(t\right)\right]_0^\tau-\int_{0}^{\tau}2tF \left(t\right)dt+{\tau^2 \left[F \left(t\right)\right]}_\tau^\infty\\ &=\tau^2F \left(\tau\right)-\int_{0}^{\tau}2t \left\{1-S \left(t\right)\right\}dt+\tau^2 \left\{1-F \left(\tau\right)\right\}\\ &= \left[-t^2\right]_0^\tau+2\int_{0}^{\tau}{t \cdot S \left(t\right)dt}+\tau^2\\ &=-\tau^2+2\int_{0}^{\tau}{t \cdot S \left(t\right)dt}+\tau^2\\ &=2\int_{0}^{\tau}{t \cdot S \left(t\right)dt}\\ &=2\int_{0}^{\tau}{t \cdot e^{-\lambda t}dt}\\ &=2 \left[-\frac{t}{\lambda}e^{-\lambda t}\right]_0^\tau+2\int_{0}^{\tau}{\frac{e^{-\lambda t}}{\lambda}dt}\\ &=-\frac{2\tau e^{-\lambda\tau}}{\lambda}+\frac{2 \left(1-e^{-\lambda\tau}\right)}{\lambda^2}\\ &=\frac{2-2\lambda\tau e^{-\lambda\tau}-2e^{-\lambda\tau}}{\lambda^2} \end{align} 分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、 \begin{align} V \left\{X \left(\tau\right)\right\}&=\frac{2-2\lambda\tau e^{-\lambda\tau}-2e^{-\lambda\tau}}{\lambda^2}-\frac{1-2e^{-\lambda t}+e^{-2\lambda t}}{\lambda^2}\\ &=\frac{1-2\lambda\tau e^{-\lambda\tau}-e^{-2\lambda\tau}}{\lambda^2} \end{align} $\blacksquare$

〔5〕ハザード・境界内平均生存時間の最尤推定値

生存関数に関する仮定より、 \begin{gather} S \left(t\right)=1-F \left(t\right)=e^{-\lambda t}\\ F \left(t\right)=1-e^{-\lambda t} \end{gather} 累積分布関数と確率密度関数の関係 $f \left(x\right)=\frac{d}{dx}F \left(x\right)$ より、 \begin{align} f \left(t\right)=\lambda e^{-\lambda t} \end{align} イベント時間の尤度関数の定義式より、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{n}{ \left[f \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}} \end{align} イベント時間の確率密度関数、ハザード関数、生存関数の関係 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ より、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{n}{ \left[f \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}}\\ &=\prod_{i=1}^{n}{ \left[\lambda e^{-\lambda t_i}\right]^{\delta_i} \left[e^{-\lambda t_i}\right]^{1-\delta_i}}\\ &=\prod_{i=1}^{n}{\lambda^{\delta_i} \cdot e^{-\lambda t_i}} \end{align} 対数尤度関数 $l \left(\theta\right)=\log{L \left(\theta\right)}$ を求めると、 \begin{align} l \left(\lambda\right)=\sum_{i=1}^{n}{\delta_i\log{\lambda}}-\lambda\sum_{i=1}^{n}t_i \end{align} スコア関数 $S \left(\theta\right)=\frac{d}{d\theta}\log{L \left(\theta\right)}$ を求めると、 \begin{align} S \left(\lambda\right)&=\frac{1}{\lambda}\sum_{i=1}^{n}\delta_i-\sum_{i=1}^{n}t_i\\ &=\frac{\delta}{\lambda}-\sum_{i=1}^{n}t_i \end{align} 尤度方程式 $S \left(\theta\right)=0$ を解くと、 \begin{gather} 0=\frac{\delta}{\hat{\lambda}}-\sum_{i=1}^{n}t_i\\ \frac{\delta}{\hat{\lambda}}=\sum_{i=1}^{n}t_i\\ \hat{\lambda}=\frac{\delta}{\sum_{i=1}^{n}t_i} \end{gather} したがって、表1 のデータから最尤推定値は、 \begin{align} \hat{\lambda}=\frac{3}{10+13+18+19+23}=\frac{3}{83}\cong0.036 \end{align} 〔4〕の結果より、$\tau=20$ とした境界内平均生存時間とその分散の推定値は、付表5の値を用いると \begin{align} \hat{E} \left\{X \left(\tau\right)\right\}&=\frac{1-e^{-0.036 \cdot 20}}{0.036}\\ &=\frac{1-e^{-0.72}}{0.036}\\ &=\frac{1-\frac{1}{e^{0.72}}}{0.036}\\ &=\frac{1-\frac{1}{2.0544}}{0.036}\\ &=\frac{0.513}{0.036}\\ &\cong14.25 \end{align} \begin{align} \hat{V} \left\{X \left(\tau\right)\right\}&=\frac{1-2 \cdot 0.036 \cdot 20 \cdot e^{-0.036 \cdot 20}-e^{-2 \cdot 0.036 \cdot 20}}{{0.036}^2}\\ &=\frac{1-2 \cdot 0.036 \cdot 20 \cdot e^{-0.72}-e^{-2 \cdot 0.72}}{{0.036}^2}\\ &=\frac{1-\frac{2 \cdot 0.036 \cdot 20}{2.0544}-\frac{1}{{2.0544}^2}}{{0.036}^2}\\ &=\frac{0.0621}{0.0013}\\ &\cong47.69 \end{align} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ