本稿には、2017年に実施された統計検定1級『医薬生物学』 問1の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕イベント確率密度関数と生存関数・ハザード関数の関係
条件付き確率の定義より、 \begin{align} \lambda \left(t\right)&=\lim_{\Delta t\rightarrow0}{\frac{1}{\Delta t}}P \left(t \le T \le t+\Delta t\middle| t \le T\right)\\ &=\lim_{\Delta t\rightarrow0}{\frac{1}{\Delta t}\frac{P \left(t \le T \le t+\Delta t,t \le T\right)}{P \left(t \le T\right)}}\\ &=\lim_{\Delta t\rightarrow0}{\frac{P \left(t \le T \le t+\Delta t\right)}{\Delta t}\frac{1}{P \left(t \le T\right)}} \end{align} 生存関数の定義 $S \left(t\right)=P \left(t \le T\right)$ より、 \begin{align} \lambda \left(t\right)=\lim_{\Delta t\rightarrow0}{\frac{P \left(t \le T \le t+\Delta t\right)}{\Delta t}\frac{1}{S \left(t\right)}} \end{align} イベント確率の分布関数の定義より、 \begin{align} \lambda \left(t\right)=\lim_{\Delta t\rightarrow0}{\frac{F \left(t+\Delta t\right)-F \left(t\right)}{\Delta t}\frac{1}{S \left(t\right)}} \end{align} 微分の定義と分布関数と確率密度関数の関係より、 \begin{gather} \lambda \left(t\right)=\frac{1}{S \left(t\right)} \cdot \frac{d}{dt}F \left(t\right)=\frac{f \left(t\right)}{S \left(t\right)}\\ f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right) \end{gather} $\blacksquare$
〔2〕累積ハザード関数と生存関数の関係
〔1〕の計算過程において、生存関数を用いると、 \begin{align} P \left(t \le T \le t+\Delta t\right)&=S \left(t\right)-S \left(t+\Delta\right)\\ &=-S \left(t+\Delta\right)-S \left(t\right) \end{align} したがって、 \begin{align} \lambda \left(t\right)&=-\lim_{\Delta\rightarrow0}{\frac{S \left(t+\Delta\right)-S \left(t\right)}{\Delta} \cdot \frac{1}{S \left(t\right)}}\\ &=-\frac{d}{dt}S \left(t\right) \cdot \frac{1}{S \left(t\right)} \end{align} 与えられた定義式を計算すると、 \begin{align} \Lambda \left(t\right)=\int_{0}^{t}{-\frac{S^\prime \left(u\right)}{S \left(u\right)}du} \end{align} 積分の公式 $\log{f \left(x\right)}=\int{\frac{f^\prime \left(x\right)}{f \left(x\right)}dx}$ より、 \begin{align} \Lambda \left(t\right)&=\int_{0}^{t}{-\frac{d}{du}\log{S \left(u\right)}du}\\ &= \left[-\log{S \left(u\right)}\right]_0^t\\ &=- \left\{\log{S \left(t\right)}-\log{S \left(0\right)}\right\}\\ &=-\log{S \left(t\right)}+0\\ &=-\log{S \left(t\right)} \end{align} $\blacksquare$
〔3〕確率積分変換
確率変数 $T$ をその分布関数で変換(確率積分変換)した確率変数 $F \left(T\right)$ の分布関数は、 \begin{align} G \left[F \left(T\right)\right]&=P \left\{F \left(T\right) \le t\right\}\\ &=P \left\{T \le F^{-1} \left(t\right)\right\}\\ &=F \left\{F^{-1} \left(t\right)\right\}\\ &=t \end{align} したがって、 \begin{gather} F \left(T\right) \sim \mathrm{U} \left(0,1\right)\\ P \left\{F \left(T\right) \gt g \left(t\right)\right\}=1-g \left(t\right) \end{gather} 〔2〕の結果より、 \begin{align} P \left\{\Lambda \left(T\right) \gt t\right\}&=P \left\{-\log{S \left(T\right)} \gt t\right\}\\ &=P \left\{S \left(T\right) \lt e^{-t}\right\}\\ &=P \left\{1-F \left(T\right) \lt e^{-t}\right\}\\ &=P \left\{F \left(T\right) \gt 1-e^{-t}\right\}\\ &=1- \left(1-e^{-t}\right)\\ &=e^{-t} \end{align} $\blacksquare$
〔4〕補対数対数変換
Cox比例ハザードモデルの定義式(1)より、 \begin{align} \Lambda \left(t\middle|\boldsymbol{Z}\right)&=\int_{0}^{t}{\lambda \left(u\middle|\boldsymbol{Z}\right)du}\\ &=\int_{0}^{t}{\lambda_0 \left(u\right) \cdot \mathrm{exp} \left(\beta^T\boldsymbol{Z}\right)du}\\ &=\mathrm{exp} \left(\beta^T\boldsymbol{Z}\right)\int_{0}^{t}{\lambda_0 \left(u\right)du}\\ &=\Lambda_0 \left(t\right) \cdot \mathrm{exp} \left(\beta^T\boldsymbol{Z}\right) \end{align} 〔2〕の結果より、$\Lambda \left(t\middle|\boldsymbol{Z}\right)=-\log{S \left(t\middle|\boldsymbol{Z}\right)}$ なので、 \begin{align} -\log{S \left(t\middle|\boldsymbol{Z}\right)}=\Lambda_0 \left(t\right) \cdot \mathrm{exp} \left(\beta^T\boldsymbol{Z}\right) \end{align} 両辺の対数を取ると、 \begin{align} \log{ \left\{-\log{S \left(t\middle|\boldsymbol{Z}\right)}\right\}}=\log{\Lambda_0 \left(t\right)}+\beta^T\boldsymbol{Z} \end{align} したがって、 \begin{align} h \left(t\right)=\log{\Lambda_0 \left(t\right)} \end{align} $\blacksquare$
〔5〕累積分布関数の導出
〔4〕の結果より、 \begin{align} \epsilon \left(t\right)=\log{ \left\{-\log{S \left(t\middle|\boldsymbol{Z}\right)}\right\}} \end{align} 両辺の $t$ を $T$ に置き換えると、 \begin{align} \epsilon \left(T\right)=\log{ \left\{-\log{S \left(T\middle|\boldsymbol{Z}\right)}\right\}} \end{align} 〔3〕と同様に、 \begin{align} P \left\{\epsilon \left(T\right) \le x\right\}&=P \left[\log{ \left\{-\log{S \left(T\middle|\boldsymbol{Z}\right)}\right\}} \le x\right]\\ &=P \left\{-\log{S \left(T\middle|\boldsymbol{Z}\right)} \le \mathrm{exp} \left(x\right)\right\}\\ &=P \left[S \left(T\middle|\boldsymbol{Z}\right) \geq \mathrm{exp} \left\{\mathrm{exp} \left(x\right)\right\}\right]\\ &=P \left[1-F \left(T\middle|\boldsymbol{Z}\right) \geq \mathrm{exp} \left\{\mathrm{exp} \left(x\right)\right\}\right]\\ &=P \left[F \left(T\middle|\boldsymbol{Z}\right) \le 1-\mathrm{exp} \left\{\mathrm{exp} \left(x\right)\right\}\right]\\ &=1-\mathrm{exp} \left\{\mathrm{exp} \left(x\right)\right\} \end{align} $\blacksquare$
〔6〕乱数の生成法
〔5〕の結果より、
\begin{gather}
\epsilon \left(T\right)=\log{ \left\{-\log{S \left(T\middle|\boldsymbol{Z}\right)}\right\}}\\
S \left(T\middle|\boldsymbol{Z}\right) \sim \mathrm{U} \left(0,1\right)
\end{gather}
よって、$V=S \left(T\middle|\boldsymbol{Z}\right)$ とすると、$\epsilon \left(T\right)$ に対する乱数は、
\begin{align}
\epsilon \left(T\right)=\log{ \left(-\log{V}\right)}
\end{align}
$\lambda_0 \left(t\right)=\frac{3}{2}\sqrt t$ なので、
\begin{align}
\Lambda_0 \left(t\right)=\int_{0}^{t}{\frac{3}{2}\sqrt u d u}=\frac{3}{2} \left[\frac{2}{3}u^\frac{3}{2}\right]_0^t=t^\frac{3}{2}
\end{align}
よって、〔4〕の結果より、
\begin{align}
h \left(t\right)=\log{\Lambda_0 \left(t\right)}=\frac{3}{2}\log{t}
\end{align}
また、〔5〕の結果より、$\beta=\frac{1}{2},\boldsymbol{Z}=Z$ を代入すると、
\begin{gather}
h \left(T\right)=-\beta^T\boldsymbol{Z}+\epsilon \left(T\right)\\
\frac{3}{2}\log{T}=-\frac{Z}{2}+\epsilon \left(T\right)\\
\log{T}=-\frac{Z}{3}+\frac{2}{3}\epsilon \left(T\right)\\
T=\mathrm{exp} \left\{-\frac{Z}{3}+\frac{2}{3}\epsilon \left(T\right)\right\}
\end{gather}
これより、次の手順で $T$ に対する乱数を得ることができる。
Step1:区間 $ \left[0,1\right]$ の一様分布に従う乱数 $U$ を生成し、$Z=40+30U$ とする。
Step2:Step1の $U$ とは独立に区間 $ \left[0,1\right]$ の一様分布に従う乱数 $V$ を生成し、$\epsilon \left(T\right)=\log{ \left(-\log{V}\right)}$ とする。
Step3:
\begin{align}
T=\mathrm{exp} \left\{-\frac{Z}{3}+\frac{2}{3}\log{ \left(-\log{V}\right)}\right\}
\end{align}
$\blacksquare$
0 件のコメント:
コメントを投稿