統計検定 1級 2016年 医薬生物学 問3 生存時間分析

公開日: 更新日:

【2023年1月2週】 【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2016年に実施された統計検定1級『医薬生物学』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕カプラン・マイヤー法による生存関数の推定

それぞれの群の瞬間ハザードと累積生存率を求めると、次のようになる。

表1 群1の生存時問データ
観察時間
(週)
打ち切り
イベント
瞬間死亡率 累積生存率
$3$ $1$ $\frac{0}{5}$ $\frac{5}{5}=1$
$5$ $1$ $\frac{0}{4}$ $1\times\frac{4}{4}=1$
$7$ $1$ $\frac{0}{3}$ $1\times\frac{3}{3}=1$
$9$ $0$ $\frac{1}{2}$ $1\times\frac{1}{2}=\frac{1}{2}$
$10$ $0$ $\frac{1}{1}$ $\frac{1}{2}\times\frac{0}{1}=0$
表2 群2の生存時問データ
観察時間
(週)
打ち切り
イベント
瞬間死亡率 累積生存率
$1$ $0$ $\frac{1}{5}$ $\frac{4}{5}$
$2$ $0$ $\frac{1}{4}$ $\frac{4}{5}\times\frac{3}{4}=\frac{3}{5}$
$4$ $1$ $\frac{0}{3}$ $\frac{3}{5}\times\frac{3}{3}=\frac{3}{5}$
$5$ $0$ $\frac{1}{2}$ $\frac{3}{5}\times\frac{1}{2}=\frac{3}{10}$
$8$ $0$ $\frac{1}{1}$ $\frac{3}{10}\times0=0$
これをもとにカプラン・マイヤー曲線を描くと次のようになる。
カプラン・マイヤー法による生存関数の推定
図1 カプラン・マイヤー法による生存関数の推定
$\blacksquare$

〔2〕ログランク検定

$i \left(=1,2,6,8,9,10\right)$ をイベントが発生した時点、$j \left(=1,2\right)$ を群番号を表すものとし、時点 $i$ における群 $j$ の値を以下のように定義する。

  • $d_{ij}$:イペント発生数
  • $n_{ij}$:リスク集合の大きさ
  • $e_{ij}$:イペント発生数の期待値
  • $d_i$:(群1と群2)全体でのイベント発生数
  • $n_i$:(群1と群2)全体でのリスク集合の大きさ

このとき、イペント発生数の期待値は、 \begin{align} e_{ij}=n_{ij}\times\frac{d_i}{n_i} \end{align} 期待値と群 $j$ での(実際の)イベント発生数との差 \begin{align} u_{ij}=d_{ij}-e_{ij} \end{align} を時点 $i$ におけるスコアとし、 このスコアを単純に合計したものが各群のスコア \begin{align} u=\sum_{i=1}^{10}u_{ij} \end{align} となる (なお、各群のスコアは、符号が反対で絶対値は等しいため、どちらで求めてもよい)。
それぞれの時点でのスコア $u_{ij}$ の分散は、イベント数が $d_i=1$ の場合は、 \begin{align} V \left(u_i\right)=\frac{n_{i1} \cdot n_{i2}}{n_i^2} \end{align} それぞれの時点でのスコアが互いに独立であるとすると、分散の性質より、 \begin{align} V \left(u\right)=\sum_{i=1}^{10}V \left(u_i\right) \end{align} こうしたことをもとに、各時点でのスコアとスコアの分散を算出すると、以下のようになる。

\
表2 スコアの算出表
$t_i$ $d_{i1}$ $d_{i2}$ $n_{i1}$ $n_{i2}$ $n_i$ $e_{i1}$ $e_{i2}$ $u_{i1}$ $u_{i2}$ $V \left(u_i\right)$
$1$ $0$ $1$ $5$ $5$ $10$ $5\times\frac{1}{10}=\frac{1}{2}$ $5\times\frac{1}{10}=\frac{1}{2}$ $0-\frac{1}{2}=-\frac{1}{2}$ $1-\frac{1}{2}=\frac{1}{2}$ $\frac{5}{10}\times\frac{5}{10}=\frac{1}{4}$
$2$ $0$ $1$ $5$ $4$ $9$ $5\times\frac{1}{9}=\frac{5}{9}$ $4\times\frac{1}{9}=\frac{4}{9}$ $0-\frac{5}{9}=-\frac{5}{9}$ $1-\frac{4}{9}=\frac{5}{9}$ $\frac{5}{9}\times\frac{4}{9}=\frac{20}{81}$
$6$ $0$ $1$ $3$ $2$ $5$ $3\times\frac{1}{5}=\frac{3}{5}$ $2\times\frac{1}{5}=\frac{2}{5}$ $0-\frac{3}{5}=-\frac{3}{5}$ $1-\frac{2}{5}=\frac{3}{5}$ $\frac{3}{5}\times\frac{2}{5}=\frac{6}{25}$
$8$ $0$ $1$ $2$ $1$ $3$ $2\times\frac{1}{3}=\frac{2}{3}$ $1\times\frac{1}{3}=\frac{1}{3}$ $0-\frac{2}{3}=-\frac{2}{3}$ $1-\frac{1}{3}=\frac{2}{3}$ $\frac{2}{3}\times\frac{1}{3}=\frac{2}{9}$
$9$ $1$ $0$ $2$ $0$ $2$ $2\times\frac{1}{2}=1$ $0\times\frac{1}{2}=0$ $1-1=0$ $0-0=0$ $\frac{0}{2}\times\frac{2}{2}=0$
$10$ $1$ $0$ $1$ $0$ $1$ $1\times\frac{1}{1}=1$ $0\times\frac{1}{1}=0$ $1-1=0$ $0-0=0$ $\frac{0}{1}\times\frac{1}{1}=0$

したがって、 \begin{align} u&=-\frac{1}{2}-\frac{5}{9}-\frac{3}{5}-\frac{2}{3}+0+0\\ &\cong-0.5-0.56-0.6-0.67\\ &=-2.33 \end{align} \begin{align} V \left(u\right)&=\frac{1}{4}+\frac{20}{81}+\frac{6}{25}+\frac{2}{9}+0+0\\ &\cong0.25+0.25+0.24+0.22\\ &=0.96 \end{align} したがって、ログランク検定の検定統計量は、 \begin{align} \chi^2=\frac{u^2}{V \left(u\right)}=\frac{ \left(-2.33\right)^2}{0.96}\cong5.62 \end{align} 帰無仮説のもとで、 \begin{align} \chi^2 \sim \chi^2 \left(1\right) \quad Z=\sqrt{\chi^2} \sim \mathrm{N} \left(0,1\right) \end{align} 付表1より、 \begin{align} \sqrt{5.62}=2.3712\cong Z_{0.0089} \left(n\right) \end{align} したがって、両側p値は、 \begin{align} p\cong0,0089\times2=0.0178 \end{align} $\blacksquare$

〔3〕コックス比例ハザードモデルの部分尤度

時点 $i$ における各群のハザードは、 \begin{gather} h_1=h \left(0,t\right)=h_0 \left(t\right)e^0=h_0 \left(t\right)\\ h_2=h \left(1,t\right)=h_0 \left(t\right)e^{\beta \cdot 1}=h_0 \left(t\right)e^\beta \end{gather} このとき、確率の乗法定理により、
「時点 $t_{ \left(i\right)}$ で群 $j$ の1人にイベントが起きる確率」=「時点 $t_{ \left(i\right)}$ でイベントが1件起きる確率」×「時点 $t_{ \left(i\right)}$ でイベントが起きたという条件付きでそれが群 $j$ の1人である確率」 \begin{align} P \left(d_{ij}=1\right)=P \left(d_i=1\right)\times P \left(d_{ij}=1\middle| d_i=1\right) \end{align} 部分尤度は、このうち「時点 $t_{ \left(i\right)}$ でイベントが起きたという条件付きでそれが群 $j$ の1人である確率」に関する尤度のことを指し、 \begin{align} L=\prod_{i=1}^{k}\frac{h \left(i\right)}{\sum_{j=1}^{n_i}h_\boldsymbol{j}} \end{align} この問題では、群2→群2→群2→群2→群1→群1という順番でイベントが発生しているが、例えば、最初の事象が起こる確率は、群1が5人、群2に5人、at riskの人(ハザードに暴露されている人)がいて、イベントが1件発生した際、それが群2の1人である確率(=全体のハザードの中で群2の1人のハザードが占める割合)なので、 \begin{align} L=\frac{h_2}{5h_1+5h_2} \end{align} 以下同様に考えていくと、全体としての部分尤度は、 \begin{align} L&=\frac{h_2}{5h_1+5h_2}\times\frac{h_2}{5h_1+4h_2}\times\frac{h_2}{3h_1+2h_2}\times\frac{h_2}{2h_1+h_2}\times\frac{h_1}{2h_1+0}\times\frac{h_1}{h_1+0}\\ &=\frac{h_0 \left(t\right)}{h_0 \left(t\right)} \left(\frac{5e^\beta}{5+5e^\beta}\times\frac{4e^\beta}{5+4e^\beta}\times\frac{2e^\beta}{3+2e^\beta}\times\frac{e^\beta}{2+e^\beta}\times\frac{1}{2}\times\frac{1}{1}\right)\\ &=\frac{5e^\beta}{5+5e^\beta}\times\frac{4e^\beta}{5+4e^\beta}\times\frac{2e^\beta}{3+2e^\beta}\times\frac{e^\beta}{2+e^\beta}\times\frac{1}{2}\times\frac{1}{1} \end{align} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ