統計検定 1級 2023年 医薬生物学 問2 生存時間分析・サンプルサイズの設計

公開日: 更新日:

【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2023年に実施された統計検定1級『医薬生物学』 問2の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕指数分布のパラメータの最尤推定

イベント時間の確率密度関数 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ は、 \begin{align} f \left(t\right)=\lambda e^{-\lambda t} \end{align} 打ち切りが存在しないとき、尤度関数は、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{n}{\lambda e^{-\lambda t_i}} \end{align} 対数尤度関数 $l \left(\theta,\boldsymbol{x}\right)=\log{L \left(\theta,\boldsymbol{x}\right)}$ は、 \begin{align} l \left(\lambda\right)&=\sum_{i=1}^{n} \left(\log{\lambda}-\lambda t_i\right)\\ &=n\log{\lambda}-\lambda\sum_{i=1}^{n}t_i \end{align} パラメータ $\lambda$ に関するスコア関数 $U \left(\lambda\right)=\frac{\partial}{\partial\lambda}l \left(\lambda\right)$ は、$T=\sum_{i=1}^{n}t_i$ として、 \begin{align} U \left(\lambda\right)=\frac{n}{\lambda}-T \end{align} 尤度方程式 $U \left(\theta\right)=0$ を解くと、パラメータ $\lambda$ の最尤推定量は、 \begin{gather} \frac{n}{\hat{\lambda}}=T\\ \hat{\lambda}=\frac{n}{T} \end{gather} $\blacksquare$

〔2〕パラメータのフィッシャー情報量

〔1〕から続けて、観測情報量 $i \left(\theta\right)=-\frac{\partial}{\partial\theta}U \left(\theta\right)$ は、 \begin{align} I_n \left(\lambda\right)&=- \left(-\frac{n}{\lambda^2}\right)\\ &=\frac{n}{\lambda^2}\\ \end{align} フィッシャー情報量 $I \left(\theta\right)=E \left[i \left(\theta\right)\right]$ は、 \begin{align} I_n \left(\lambda\right)&=E \left(\frac{n}{\lambda^2}\right)\\ &=\frac{n}{\lambda^2} \end{align} $\blacksquare$

〔3〕有意水準・検出力・臨床的有意差の関係

①帰無仮説での有意水準と棄却域
問題文の仮定より、検定統計量 $Z$ は、帰無仮説のもとで、 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} したがって、帰無仮説における検定統計量の棄却域は、 \begin{gather} z_\alpha \lt Z \end{gather}

②対立仮説での棄却域と検出力
同様に、検定統計量 $Z$ は、対立仮説のもとで、 \begin{gather} Z \sim \mathrm{N} \left(\mu,1\right) \end{gather} ここで、正規分布の性質などにより、 \begin{gather} W=Z-\mu\\ W \sim \mathrm{N} \left(0,1\right) \end{gather} 検出力の定義(対立仮説のもとで、帰無仮説を棄却する事象が起こる)より、 \begin{align} 1-\beta&=P \left(z_\alpha \lt Z\middle| H_1\right)\\ &=P \left(z_\alpha-\mu \lt Z-\mu\right)\\ &=P \left(z_\alpha-\mu \lt W\right)\\ &=P \left(z_{1-\beta} \lt W\right) \end{align} したがって、$z_{1-\beta}=-z_\beta$ より、 \begin{gather} z_{1-\beta}=z_\alpha-\mu\\ \mu=z_\alpha-z_{1-\beta}\\ \mu=z_\alpha+z_\beta \end{gather} $\blacksquare$

〔4〕サンプルサイズの設計公式

〔1〕、〔2〕の結果と問題文の仮定より、最尤推定量 $\hat{\lambda}$ は漸近的に、 \begin{gather} \hat{\lambda} \sim \mathrm{N} \left(\lambda,\phi^2\right)\\ \phi^2=\frac{\lambda^2}{n} \end{gather} これを標準化した値は、 \begin{align} \frac{\hat{\lambda}-\lambda}{\phi}=Z \sim \mathrm{N} \left(0,1\right) \end{align} 問題文の設定より、 \begin{align} Z=\frac{\hat{\lambda}-\lambda_0}{\sigma} \quad \sigma^2=\frac{\lambda_1^2}{n} \end{align} この式を変形すると、 \begin{align} \hat{\lambda}=\lambda_0+Z\sigma \end{align} 両辺の期待値を取ると、問題文の仮定より、 \begin{gather} E \left(\hat{\lambda}\right)=\lambda_0+\sigma E \left(Z\right)\\ \lambda_1=\lambda_0+\sigma E \left(Z\right)\\ E \left(Z\right)=\frac{\lambda_1-\lambda_0}{\sigma} \end{gather} 〔3〕の結果より、対立仮説のもとで、 \begin{align} E \left(Z\right)&=\mu\\ &=z_\alpha+z_\beta \end{align} となるとき、有意水準と検出力がそれぞれ $\alpha,1-\beta$ となる。 したがって、 \begin{gather} \frac{\lambda_1-\lambda_0}{\sigma}=z_\alpha+z_\beta\\ \frac{ \left(\lambda_1-\lambda_0\right)\sqrt n}{\lambda_1}=z_\alpha+z_\beta\\ \sqrt n=\frac{\lambda_1 \left(z_\alpha+z_\beta\right)}{\lambda_1-\lambda_0}\\ n= \left\{\frac{\lambda_1 \left(z_\alpha+z_\beta\right)}{\lambda_1-\lambda_0}\right\}^2 \end{gather} $\blacksquare$

〔5〕サンプルサイズの算出

問題文の条件より、時点 $t$ における累積分布関数(感染症の回復率)は、 \begin{align} F \left(t\right)=1-e^{-\lambda t} \end{align} 問題文の仮定より、帰無仮説におけるパラメータは、付表5より、 \begin{gather} F \left(5\right)=0.5\\ 1-e^{-5\lambda_0}=0.5\\ e^{-5\lambda_0}=0.5\\ -5\lambda_0=\log{0.5}\\ \lambda_0=-\frac{1}{5}\log{0.5} \end{gather} \begin{align} \lambda_0&=-\frac{1}{5} \left(\log{5}-1\right) \cdot 2.3026\\ &=-\frac{1}{5} \left(0.6990-1\right) \cdot 2.3026\\ &=0.139 \end{align} 対立仮説におけるパラメータは、 \begin{gather} F \left(5\right)=0.75\\ 1-e^{-5\lambda_1}=0.75\\ e^{-5\lambda_1}=0.25\\ -5\lambda_1=\log{0.25}\\ \lambda_1=-\frac{1}{5}\log{0.25} \end{gather} \begin{align} \lambda_1&=-\frac{1}{5} \left(\log{1}-\log{4}\right) \cdot 2.3026\\ &=-\frac{1}{5} \left(0-0.6021\right) \cdot 2.3026\\ &=0.277 \end{align} 〔4〕の結果より、 \begin{align} n&= \left\{\frac{\lambda_1 \left(z_\alpha+z_\beta\right)}{\lambda_1-\lambda_0}\right\}^2\\ &= \left\{\frac{0.277 \left(1.960+0.842\right)}{0.277-0.139}\right\}^2\\ &= \left(\frac{0.277 \cdot 2.802}{0.139}\right)^2\\ &={5.604}^2\\ &\cong31.4 \end{align} したがって、検出力80%以上を満たす最小の被験者数は、 \begin{align} n=32 \end{align} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

QooQ