統計検定 1級 2024年 医薬生物学 問1 診断検査の性能評価、マクネマー検定

公開日: 更新日:

【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2024年に実施された統計検定1級『医薬生物学』 問1の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 統計検定の問題の使用に関する規約により禁止されているため、問題文は掲載することができません。公式サイトで公開されているものなどをご参照ください。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕指標の定義とROC曲線

〔1-1〕指標の定義

感度の定義より、 \begin{align} a=\frac{12}{20}=0.6 \end{align} 特異度の定義より、 \begin{align} b=\frac{17}{20}=0.85 \end{align} 陽性的中率の定義より、 \begin{align} c=\frac{12}{12+3}=0.8 \end{align} 陰性的中率の定義より、 \begin{align} d=\frac{17}{8+17}=0.68 \end{align} $\blacksquare$

〔1-2〕ROC曲線

与えられた表1と〔1-1〕の結果より、ROC曲線を描くと以下のようになる。このとき曲線下面積は、 \begin{align} S_1&=0.15\times0.6\div2\\ &=0.045 \end{align} \begin{align} S_2&= \left(0.6-0.15\right)\times0.6+ \left(0.6-0.15\right)\times \left(0.9-0.6\right)\div2\\ &=0.27+0.0675\\ &=0.3375 \end{align} \begin{align} S_3&= \left(1-0.6\right)\times0.9+ \left(1-0.6\right)\times \left(1-0.9\right)\div2\\ &=0.36+0.02\\ &=0.38 \end{align} したがって、 \begin{align} S&=S_1+S_2+S_3\\ &=0.045+0.3375+0.38\\ &=0.7625 \end{align} $\blacksquare$

「ROC曲線」のイメージ図
図1 ROC曲線

〔2〕対応のある2値データ

〔2-1〕対応のある2値データの期待値と分散

〔i〕期待値
確率変数 $Z_i$ の取り得る値は、 \begin{gather} X_i=1,Y_i=1 \quad \Rightarrow \quad Z_i=1-1=0\\ X_i=1,Y_i=0 \quad \Rightarrow \quad Z_i=1-0=1\\ X_i=0,Y_i=1 \quad \Rightarrow \quad Z_i=0-1=-1\\ X_i=0,Y_i=0 \quad \Rightarrow \quad Z_i=0-0=0\\ \end{gather} 期待値の定義より \begin{align} E \left(Z_i\right)&=0 \cdot \pi_{11}+1 \cdot \pi_{10}+ \left(-1\right) \cdot \pi_{01}+0 \cdot \pi_{11}\\ &=\pi_{10}-\pi_{01} \end{align} $\blacksquare$

〔ii〕分散
期待値の定義より \begin{align} E \left(Z_i^2\right)&=0^2 \cdot \pi_{11}+1^2 \cdot \pi_{10}+ \left(-1\right)^2 \cdot \pi_{01}+0^2 \cdot \pi_{11}\\ &=\pi_{10}+\pi_{01} \end{align} 分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より \begin{align} V \left(Z_i\right)&=\pi_{10}+\pi_{01}- \left(\pi_{10}-\pi_{01}\right)^2\\ &=\pi_{10}-\pi_{10}^2+\pi_{01}-\pi_{01}^2+2\pi_{10}\pi_{01}\\ &=\pi_{10} \left(1-\pi_{10}\right)+\pi_{01} \left(1-\pi_{01}\right)+2\pi_{10}\pi_{01}\\ \end{align} $\blacksquare$

〔2-2〕対応のある2値データに対する検定統計量

本問における観測データ $n_{jk}$ は、〔3〕の表2に整理されるような四項分布 \begin{gather} \boldsymbol{n}= \left\{n_{11},n_{10},n_{01},n_{00}\right\}\\ \boldsymbol{\pi}= \left\{\pi_{11},\pi_{10},\pi_{01},\pi_{00}\right\}\\ \boldsymbol{n} \sim \mathrm{MN} \left(N,\boldsymbol{\pi}\right) \end{gather} に従うと考えられる。

$X_i=1$ となる人数 $n_{1 \cdot }$ と $Y_i=1$ となる人数 $n_{ \cdot 1}$ はそれぞれ、 \begin{gather} n_{1 \cdot }=n_{11}+n_{10}\\ n_{ \cdot 1}=n_{11}+n_{01} \end{gather} したがって、与えられた定義より、 \begin{align} {\hat{\pi}}_X&=\frac{1}{N}\sum_{i=1}^{N}X_i\\ &=\frac{n_{1 \cdot }}{N}\\ &=\frac{n_{11}+n_{10}}{N}\\ \end{align} \begin{align} {\hat{\pi}}_Y&=\frac{1}{N}\sum_{i=1}^{N}Y_i\\ &=\frac{n_{ \cdot 1}}{N}\\ &=\frac{n_{11}+n_{01}}{N}\\ \end{align} これらより、標本比率の差は \begin{align} {\hat{\pi}}_X-{\hat{\pi}}_Y&=\frac{n_{11}+n_{10}}{N}-\frac{n_{11}+n_{01}}{N}\\ &=\frac{n_{10}-n_{01}}{N} \end{align}

また、標本比率の差の分散は、分散の性質より、 \begin{align} V \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)&=V \left(\frac{n_{10}-n_{01}}{N}\right)\\ &=\frac{1}{N^2}V \left(n_{10}-n_{01}\right)\\ \end{align} 差の分散の一般公式と多項分布の共分散の公式より、 \begin{align} V \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)&=\frac{V \left(n_{10}\right)+V \left(n_{01}\right)-2\mathrm{Cov} \left(n_{10},n_{01}\right)}{N^2}\\ &=\frac{ \left\{N\pi_{10} \left(1-\pi_{10}\right)+N\pi_{01} \left(1-\pi_{01}\right)+2N\pi_{10}\pi_{01}\right\}}{N^2}\\ &=\frac{\pi_{10}-\pi_{10}^2+\pi_{01}-\pi_{01}^2+2\pi_{10}\pi_{01}}{N}\\ &=\frac{\pi_{10}+\pi_{01}- \left(\pi_{10}-\pi_{01}\right)^2}{N} \end{align} ここで、 \begin{align} \pi_X=\pi_{11}+\pi_{10} \quad \pi_Y=\pi_{11}+\pi_{01} \end{align} 帰無仮説を変形すると、 \begin{gather} \pi_X=\pi_Y\\ \pi_{11}+\pi_{10}=\pi_{11}+\pi_{01}\\ \pi_{10}=\pi_{01} \end{gather} したがって、帰無仮説の下での標本比率の差の分散は、 \begin{align} V \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)=\frac{\pi_{10}+\pi_{01}}{N} \end{align} 未知パラメータを推定値に置き換えた推定量は、 \begin{align} \hat{V} \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)=\frac{{\hat{\pi}}_{10}+{\hat{\pi}}_{01}}{N} \end{align} したがって、問題文で定義された検定統計量は、 \begin{align} W&=\frac{ \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)^2}{\hat{V} \left({\hat{\pi}}_X-{\hat{\pi}}_Y\right)}\\ &= \left(\frac{n_{10}-n_{01}}{N}\right)^2 \left(\frac{N}{{\hat{\pi}}_{10}+{\hat{\pi}}_{01}}\right)\\ &=\frac{ \left(n_{10}-n_{01}\right)^2}{N \left({\hat{\pi}}_{10}+{\hat{\pi}}_{01}\right)}\\ &=\frac{ \left(n_{10}-n_{01}\right)^2}{N{\hat{\pi}}_{10}+N{\hat{\pi}}_{01}}\\ \end{align} $N{\hat{\pi}}_{10}=n_{10},N{\hat{\pi}}_{01}=n_{01}$ より、 \begin{align} W=\frac{ \left(n_{10}-n_{01}\right)^2}{n_{10}+n_{01}} \end{align} $\blacksquare$

〔3〕マクネマー検定

〔3-1〕検定統計量の漸近分布

多項分布が漸近的に多変量正規分布に従うことから、〔2-2〕で求めた検定統計量は、標準正規分布に従う確率変数の2乗値となり、$\chi^2$ 分布の定義より、帰無仮説の下で、自由度1の $\chi^2$ 分布に従う。 $\blacksquare$

〔3-2〕マクネマー検定の実行

〔2-2〕の結果より、 \begin{align} W&=\frac{ \left(26-16\right)^2}{26+16}\\ &=\frac{100}{42}\\ &\cong2.38 \end{align} 付表3より、 \begin{align} W=2.38 \lt 3.84=\chi_{0.05}^2 \end{align} となるため、帰無仮説は棄却されない。 $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

QooQ