本稿には、2018年に実施された統計検定1級『医薬生物学』 問4の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕反応確率の対数尤度関数
確率変数 $Y_i$ の確率関数は、 \begin{gather} P \left(y_i\middle|\theta_i\right)=\theta_i^{y_i} \left(1-\theta_i\right)^{1-y_i}\\ y_i=0,1 \quad i=1,2, \cdots ,n \end{gather} 観測値 $\boldsymbol{y}= \left\{y_1,y_2, \cdots ,y_n\right\}$ にもとづくパラメータ $\theta_i$ の尤度関数は \begin{align} L \left(\boldsymbol{\theta}\right)=\prod_{i=1}^{n}{\theta_i^{y_i} \left(1-\theta_i\right)^{1-y_i}} \end{align} バラメータ $\beta_j \left(j=1,2, \cdots ,p\right)$ の尤度関数は \begin{align} L \left(\boldsymbol{\beta}\right)&=\prod_{i=1}^{n} \left\{\frac{\mathrm{exp} \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)}{1+\mathrm{exp} \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)}\right\}^{y_i} \cdot \left\{\frac{1}{1+\mathrm{exp} \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)}\right\}^{1-y_i}\\ &=\prod_{i=1}^{n}\frac{\mathrm{exp} \left\{y_i \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)\right\}}{1+\mathrm{exp} \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)}\\ \end{align} これより、対数尤度関数 $l \left(\boldsymbol{\beta}\right)=\log{L \left(\boldsymbol{\beta}\right)}$ は \begin{align} l \left(\boldsymbol{\beta}\right)=\sum_{i=1}^{n}{y_i \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)}-\sum_{i=1}^{n}\log{ \left\{1+\mathrm{exp} \left(\beta_0+\beta_1x_{i1}+ \cdots +\beta_{ip}x_{ip}\right)\right\}} \end{align} $\blacksquare$
〔2〕偏回帰係数と調整対数オッズ比の関係
式 $(1)$ を変形すると、 \begin{align} \log{\frac{\theta}{1-\theta}}=\beta_0+\beta_1x_1+ \cdots +\beta_px_p \end{align} 対数オッズ比の定義式より、 \begin{align} \log{\mathrm{OR}}&=\log{\frac{\frac{P \left(\ Y=1\ \middle|\ x_1=1,x_2, \cdots ,x_p\ \right)}{P \left(\ Y=0\ \middle|\ x_1=1,x_2, \cdots ,x_p\ \right)}}{\frac{P \left(\ Y=1\ \middle|\ x_1=0,x_2, \cdots ,x_p\ \right)}{P \left(\ Y=0\ \middle|\ x_1=0,x_2, \cdots ,x_p\ \right)}}}\\ &=\log{\frac{P \left(\ Y=1\ \middle|\ x_1=1,x_2, \cdots ,x_p\ \right)}{P \left(\ Y=0\ \middle|\ x_1=1,x_2, \cdots ,x_p\ \right)}}-\log{\frac{P \left(\ Y=1\ \middle|\ x_1=0,x_2, \cdots ,x_p\ \right)}{P \left(\ Y=0\ \middle|\ x_1=0,x_2, \cdots ,x_p\ \right)}}\\ &=\log{\frac{\frac{\mathrm{exp} \left(\beta_0+\beta_1+ \cdots +\beta_px_p\right)}{1+\mathrm{exp} \left(\beta_0+\beta_1+ \cdots +\beta_px_p\right)}}{\frac{1}{1+\mathrm{exp} \left(\beta_0+\beta_1+ \cdots +\beta_px_p\right)}}}-\log{\frac{\frac{\mathrm{exp} \left(\beta_0+ \cdots +\beta_px_p\right)}{1+\mathrm{exp} \left(\beta_0+ \cdots +\beta_px_p\right)}}{\frac{1}{1+\mathrm{exp} \left(\beta_0+ \cdots +\beta_px_p\right)}}} &= \left(\beta_0+\beta_1\times1+ \cdots +\beta_px_p\right)- \left(\beta_0+\beta_1\times0+ \cdots +\beta_px_p\right) \log{\mathrm{OR}}=\beta_1 \end{align} $\blacksquare$
〔3〕赤池情報量規準(AIC)
AICの定義式より、
$\mathrm{AIC}=-2\log{L \left(\boldsymbol{\beta}\right)}+2k$
$\log{L \left(\boldsymbol{\beta}\right)}$ は、対数尤度の最大値
$k$ は自由に値を取れるパラメータの数
この式に、$L \left(\boldsymbol{\beta}\right)=\log{L \left({\hat{\beta}}_0,{\hat{\beta}}_1, \cdots ,{\hat{\beta}}_p\right)},k=p+1$ を代入すると、〔2〕の結果より、
\begin{align}
\mathrm{AIC}&=-2\times\log{L \left({\hat{\beta}}_0,{\hat{\beta}}_1, \cdots ,{\hat{\beta}}_p\right)}+2 \left(p+1\right)\\
&=-2\sum_{i=1}^{n}{y_i \left({\hat{\beta}}_0+{\hat{\beta}}_1x_{i1}+ \cdots +{\hat{\beta}}_px_{ip}\right)}+2\sum_{i=1}^{n}\log{ \left\{1+\mathrm{exp} \left({\hat{\beta}}_0+{\hat{\beta}}_1x_{i1}+ \cdots +{\hat{\beta}}_px_{ip}\right)\right\}}+2 \left(p+1\right)
\end{align}
$\blacksquare$
〔4〕カルバック・ライブラー情報量
カルバック・ライブラー情報量の定義式より、 \begin{align} I \left(g;f\right)&=E \left[\log{\frac{g \left(x\right)}{f \left(x\right)}}\right]\\ &=\sum_{x=0}^{1}{g \left(x\right) \cdot \log{\frac{g \left(x\right)}{f \left(x\right)}}} \end{align} ここで、 \begin{gather} g \left(x\right)=\theta^x \cdot \left(1-\theta\right)^{1-x}\\ f \left(x\right)=\pi^x \cdot \left(1-\pi\right)^{1-x} \end{gather} したがって、 \begin{align} I \left(g;f\right)&=g \left(1\right) \cdot \log{\frac{g \left(1\right)}{f \left(1\right)}}+g \left(0\right) \cdot \log{\frac{g \left(0\right)}{f \left(0\right)}}\\ &=\theta\log{\frac{\theta}{\pi}}+ \left(1-\theta\right)\log{\frac{1-\theta}{1-\pi}} \end{align} $\blacksquare$
〔5〕分析結果の解釈
ロジスティック回帰分析の結果(表1)から、年齢、性別、頭痛の既往、感音性が疾病発症のリスク因子であることが分かった。また、図1より、このモデルに基づく予測は、医師単独の予測よりも感度と特異度の観点から優れていることが示唆された。 $\blacksquare$
0 件のコメント:
コメントを投稿