統計検定 1級 2018年 医薬生物学 問1 生存時間分析:指数分布モデル

公開日: 更新日:

【2023年1月4週】 【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2018年に実施された統計検定1級『医薬生物学』 問1の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕指数分布の尤度関数:打ち切りがない場合

尤度関数 $L \left(\theta\right)$ を求めると、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{n}{\lambda e^{-\lambda t_i}}\\ &=e^{-\lambda \left(t_1+t_2+ \cdots +t_n\right)} \cdot \lambda^n\\ &=e^{-\lambda\sum_{i=1}^{n}t_i} \cdot \lambda^n \end{align} $\blacksquare$

〔2〕指数分布の尤度関数:打ち切りがある場合

指数分布の分布関数は、 \begin{align} F \left(t\right)&=\int_{0}^{t}{\lambda e^{-\lambda u}du}\\ &=\lambda \left[-\frac{1}{\lambda}e^{-\lambda u}\right]_0^t\\ &=- \left(e^{-\lambda t}-e^0\right)\\ &=1-e^{-\lambda t} \end{align} 生存関数と分布関数の関係 $S \left(t\right)=1-F \left(t\right)$ より、 \begin{align} S \left(t\right)&=1- \left(1-e^{-\lambda t}\right)\\ &=e^{-\lambda t} \end{align} イベント時間の尤度関数の定義式より、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{n}{ \left[f \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}} \end{align} イベント時間の確率密度関数、ハザード関数、生存関数の関係 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ より、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{n}{ \left[\lambda \left(t_i\right) \cdot S \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}}\\ &=\prod_{i=1}^{n}{ \left[\lambda \left(t_i\right)\right]^{\delta_i} \cdot S \left(t_i\right)}\\ &=\prod_{i=1}^{n}{\lambda^{\delta_i} \cdot e^{-\lambda t_i}} \end{align} $\blacksquare$

〔3〕最尤推定量とフィッシャー情報量の導出:打ち切りがある場合

〔2〕の結果より、対数尤度関数 $l \left(\theta\right)=\log{L \left(\theta\right)}$ を求めると、 \begin{align} l \left(\lambda\right)=\sum_{i=1}^{n}{\delta_i\log{\lambda}}-\lambda\sum_{i=1}^{n}t_i \end{align} スコア関数 $S \left(\theta\right)=\frac{d}{d\theta}\log{L \left(\theta\right)}$ を求めると、 \begin{align} S \left(\lambda\right)&=\frac{1}{\lambda}\sum_{i=1}^{n}\delta_i-\sum_{i=1}^{n}t_i\\ &=\frac{\delta}{\lambda}-\sum_{i=1}^{n}t_i \end{align} 尤度方程式 $S \left(\theta\right)=0$ を解くと、 \begin{gather} 0=\frac{\delta}{\hat{\lambda}}-\sum_{i=1}^{n}t_i\\ \frac{\delta}{\hat{\lambda}}=\sum_{i=1}^{n}t_i\\ \hat{\lambda}=\frac{\delta}{\sum_{i=1}^{n}t_i} \end{gather} フィッシャー情報量の定義式 $I_n \left(\theta\right)=E \left[-\frac{\partial}{\partial\theta}S \left(\theta\right)\right]$ より、 \begin{align} I \left(\lambda\right)&=E \left[- \left(-\frac{\delta}{\lambda^2}\right)\right]\\ &=\frac{\delta}{\lambda^2} \end{align} $\blacksquare$

〔4〕対数ハザード比の漸近分散

デルタ法を用いて $g \left({\hat{\lambda}}_i\right)=\log{{\hat{\lambda}}_i}$ を期待値 $E \left({\hat{\lambda}}_i\right)=\lambda_i$ まわりで近似すると、 \begin{gather} g \left({\hat{\lambda}}_i\right)\cong g \left(\lambda_i\right)+g^\prime \left(\lambda_i\right) \left({\hat{\lambda}}_i-\lambda_i\right)\\ \log{{\hat{\lambda}}_i}\cong\log{\lambda_i}+\frac{1}{\lambda_i} \left({\hat{\lambda}}_i-\lambda_i\right)\\ E \left(\log{{\hat{\lambda}}_i}\right)\cong\log{\lambda_i}\\ V \left(\log{{\hat{\lambda}}_i}\right)\cong\frac{1}{\lambda_i^2}V \left({\hat{\lambda}}_i\right) \end{gather} 〔3〕の結果より、$\log{{\hat{\lambda}}_i}$ の漸近分散は、 \begin{align} V \left(\log{{\hat{\lambda}}_i}\right)\cong\frac{1}{\lambda_i^2} \cdot \frac{\lambda_i^2}{d_i}=\frac{1}{d_i} \end{align} ここで、 ${\hat{\lambda}}_1$ と ${\hat{\lambda}}_2$ が互いに独立 $\Rightarrow$ $\log{{\hat{\lambda}}_1}$ と $\log{{\hat{\lambda}}_2}$ も互いに独立 したがって、分散の性質 $V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)$ より、 \begin{align} V \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)\cong\frac{1}{d_1}+\frac{1}{d_2} \end{align} したがって、帰無仮説 $\log{\lambda_1}=\log{\lambda_2}$ を検定するための $Z$ 検定統計量は、 \begin{align} Z&=\frac{\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}}{\sqrt{V \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}}\\ &=\frac{\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}}{\sqrt{\frac{1}{d_1}+\frac{1}{d_2}}} \end{align} $\blacksquare$

〔5〕サンプルサイズの設計

〔4〕の帰無仮説のもとでは、漸近的に \begin{align} \log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2} \sim \mathrm{N} \left(0,\frac{1}{d_1}+\frac{1}{d_2}\right) \end{align} 対立仮説のもとでは、漸近的に \begin{align} \log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2} \sim \mathrm{N} \left(\log{\lambda_1}-\log{\lambda_2},\frac{1}{d_1}+\frac{1}{d_2}\right) \end{align} 期待=必要イベント数が $d=r$ のとき、両仮説における検定統計量は、 \begin{gather} Z_0=\frac{\sqrt r \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}{\sqrt2}\\ Z_1=\frac{\sqrt r \left\{ \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)- \left(\log{\lambda_1}-\log{\lambda_2}\right)\right\}}{\sqrt2} \end{gather} 検出力の定義式より、 \begin{align} 1-\beta&=P \left(Z_{0.5\alpha} \le Z_0\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha} \le \frac{\sqrt r \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}{\sqrt2}\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2} \le \frac{\sqrt r \left\{ \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)- \left(\log{\lambda_1}-\log{\lambda_2}\right)\right\}}{\sqrt2}\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2} \le Z_1\middle| H_1\right) \end{align} したがって、 \begin{gather} Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{1-\beta}\\ \frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{0.5\alpha}-Z_{1-\beta}\\ \frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{0.5\alpha}+Z_\beta \end{gather} この式を $r$ について解くと、 \begin{gather} \sqrt r=\frac{\sqrt2 \left(Z_{0.5\alpha}+Z_\beta\right)}{\log{\lambda_1}-\log{\lambda_2}}\\ r=\frac{2 \left(Z_{0.5\alpha}+Z_\beta\right)^2}{ \left(\log{\lambda_1}-\log{\lambda_2}\right)^2} \end{gather} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ