本稿には、2018年に実施された統計検定1級『医薬生物学』 問1の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕指数分布の尤度関数:打ち切りがない場合
尤度関数 $L \left(\theta\right)$ を求めると、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{n}{\lambda e^{-\lambda t_i}}\\ &=e^{-\lambda \left(t_1+t_2+ \cdots +t_n\right)} \cdot \lambda^n\\ &=e^{-\lambda\sum_{i=1}^{n}t_i} \cdot \lambda^n \end{align} $\blacksquare$
〔2〕指数分布の尤度関数:打ち切りがある場合
指数分布の分布関数は、 \begin{align} F \left(t\right)&=\int_{0}^{t}{\lambda e^{-\lambda u}du}\\ &=\lambda \left[-\frac{1}{\lambda}e^{-\lambda u}\right]_0^t\\ &=- \left(e^{-\lambda t}-e^0\right)\\ &=1-e^{-\lambda t} \end{align} 生存関数と分布関数の関係 $S \left(t\right)=1-F \left(t\right)$ より、 \begin{align} S \left(t\right)&=1- \left(1-e^{-\lambda t}\right)\\ &=e^{-\lambda t} \end{align} イベント時間の尤度関数の定義式より、 \begin{align} L \left(\lambda\right)=\prod_{i=1}^{n}{ \left[f \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}} \end{align} イベント時間の確率密度関数、ハザード関数、生存関数の関係 $f \left(t\right)=\lambda \left(t\right) \cdot S \left(t\right)$ より、 \begin{align} L \left(\lambda\right)&=\prod_{i=1}^{n}{ \left[\lambda \left(t_i\right) \cdot S \left(t_i\right)\right]^{\delta_i} \left[S \left(t_i\right)\right]^{1-\delta_i}}\\ &=\prod_{i=1}^{n}{ \left[\lambda \left(t_i\right)\right]^{\delta_i} \cdot S \left(t_i\right)}\\ &=\prod_{i=1}^{n}{\lambda^{\delta_i} \cdot e^{-\lambda t_i}} \end{align} $\blacksquare$
〔3〕最尤推定量とフィッシャー情報量の導出:打ち切りがある場合
〔2〕の結果より、対数尤度関数 $l \left(\theta\right)=\log{L \left(\theta\right)}$ を求めると、 \begin{align} l \left(\lambda\right)=\sum_{i=1}^{n}{\delta_i\log{\lambda}}-\lambda\sum_{i=1}^{n}t_i \end{align} スコア関数 $S \left(\theta\right)=\frac{d}{d\theta}\log{L \left(\theta\right)}$ を求めると、 \begin{align} S \left(\lambda\right)&=\frac{1}{\lambda}\sum_{i=1}^{n}\delta_i-\sum_{i=1}^{n}t_i\\ &=\frac{\delta}{\lambda}-\sum_{i=1}^{n}t_i \end{align} 尤度方程式 $S \left(\theta\right)=0$ を解くと、 \begin{gather} 0=\frac{\delta}{\hat{\lambda}}-\sum_{i=1}^{n}t_i\\ \frac{\delta}{\hat{\lambda}}=\sum_{i=1}^{n}t_i\\ \hat{\lambda}=\frac{\delta}{\sum_{i=1}^{n}t_i} \end{gather} フィッシャー情報量の定義式 $I_n \left(\theta\right)=E \left[-\frac{\partial}{\partial\theta}S \left(\theta\right)\right]$ より、 \begin{align} I \left(\lambda\right)&=E \left[- \left(-\frac{\delta}{\lambda^2}\right)\right]\\ &=\frac{\delta}{\lambda^2} \end{align} $\blacksquare$
〔4〕対数ハザード比の漸近分散
デルタ法を用いて $g \left({\hat{\lambda}}_i\right)=\log{{\hat{\lambda}}_i}$ を期待値 $E \left({\hat{\lambda}}_i\right)=\lambda_i$ まわりで近似すると、 \begin{gather} g \left({\hat{\lambda}}_i\right)\cong g \left(\lambda_i\right)+g^\prime \left(\lambda_i\right) \left({\hat{\lambda}}_i-\lambda_i\right)\\ \log{{\hat{\lambda}}_i}\cong\log{\lambda_i}+\frac{1}{\lambda_i} \left({\hat{\lambda}}_i-\lambda_i\right)\\ E \left(\log{{\hat{\lambda}}_i}\right)\cong\log{\lambda_i}\\ V \left(\log{{\hat{\lambda}}_i}\right)\cong\frac{1}{\lambda_i^2}V \left({\hat{\lambda}}_i\right) \end{gather} 〔3〕の結果より、$\log{{\hat{\lambda}}_i}$ の漸近分散は、 \begin{align} V \left(\log{{\hat{\lambda}}_i}\right)\cong\frac{1}{\lambda_i^2} \cdot \frac{\lambda_i^2}{d_i}=\frac{1}{d_i} \end{align} ここで、 ${\hat{\lambda}}_1$ と ${\hat{\lambda}}_2$ が互いに独立 $\Rightarrow$ $\log{{\hat{\lambda}}_1}$ と $\log{{\hat{\lambda}}_2}$ も互いに独立 したがって、分散の性質 $V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)$ より、 \begin{align} V \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)\cong\frac{1}{d_1}+\frac{1}{d_2} \end{align} したがって、帰無仮説 $\log{\lambda_1}=\log{\lambda_2}$ を検定するための $Z$ 検定統計量は、 \begin{align} Z&=\frac{\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}}{\sqrt{V \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}}\\ &=\frac{\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}}{\sqrt{\frac{1}{d_1}+\frac{1}{d_2}}} \end{align} $\blacksquare$
〔5〕サンプルサイズの設計
〔4〕の帰無仮説のもとでは、漸近的に \begin{align} \log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2} \sim \mathrm{N} \left(0,\frac{1}{d_1}+\frac{1}{d_2}\right) \end{align} 対立仮説のもとでは、漸近的に \begin{align} \log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2} \sim \mathrm{N} \left(\log{\lambda_1}-\log{\lambda_2},\frac{1}{d_1}+\frac{1}{d_2}\right) \end{align} 期待=必要イベント数が $d=r$ のとき、両仮説における検定統計量は、 \begin{gather} Z_0=\frac{\sqrt r \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}{\sqrt2}\\ Z_1=\frac{\sqrt r \left\{ \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)- \left(\log{\lambda_1}-\log{\lambda_2}\right)\right\}}{\sqrt2} \end{gather} 検出力の定義式より、 \begin{align} 1-\beta&=P \left(Z_{0.5\alpha} \le Z_0\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha} \le \frac{\sqrt r \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)}{\sqrt2}\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2} \le \frac{\sqrt r \left\{ \left(\log{{\hat{\lambda}}_1}-\log{{\hat{\lambda}}_2}\right)- \left(\log{\lambda_1}-\log{\lambda_2}\right)\right\}}{\sqrt2}\middle| H_1\right)\\ &=P \left(Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2} \le Z_1\middle| H_1\right) \end{align} したがって、 \begin{gather} Z_{0.5\alpha}-\frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{1-\beta}\\ \frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{0.5\alpha}-Z_{1-\beta}\\ \frac{\sqrt r \left(\log{\lambda_1}-\log{\lambda_2}\right)}{\sqrt2}=Z_{0.5\alpha}+Z_\beta \end{gather} この式を $r$ について解くと、 \begin{gather} \sqrt r=\frac{\sqrt2 \left(Z_{0.5\alpha}+Z_\beta\right)}{\log{\lambda_1}-\log{\lambda_2}}\\ r=\frac{2 \left(Z_{0.5\alpha}+Z_\beta\right)^2}{ \left(\log{\lambda_1}-\log{\lambda_2}\right)^2} \end{gather} $\blacksquare$
0 件のコメント:
コメントを投稿