本稿には、2019年に実施された統計検定1級『医薬生物学』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕検査の感度・陽性的中率の算出
感度とは、「疾患に罹患している人の中で、陽性と判定される確率」のことである。したがって、疾患 $D$ に罹患している群(90人)に着目すると、感度はそれぞれ、 \begin{gather} \mathrm{Sen} \left(A\right)=\frac{72}{90}=\frac{4}{5}=0.8\\ \mathrm{Sen} \left(B\right)=\frac{81}{90}=\frac{9}{10}=0.9 \end{gather} いっぽう、陽性的中率は、「陽性と判定された人の中で、実際に疾患に罹患している人の割合」のことである。それぞれの検査法で陽性と判定された群に着目すると、陽性的中率は、それぞれ、 \begin{gather} \mathrm{PPV} \left(A\right)=\frac{72}{72+18}=\frac{4}{5}=0.8\\ \mathrm{PPV} \left(B\right)=\frac{81}{81+9}=\frac{9}{10}=0.9 \end{gather} $\blacksquare$
〔2〕マクネマー検定の実施
ヒントにあるように、疾患 $D$ に罹思している群の中で、検査法 $A$ と検査法 $B$ で結果が異なるセルというという条件のもとで、 $ \left(A,B\right)=$(陽性,陰性) のセルの観測度数は、帰無仮説のもとで、 \begin{align} X \sim \mathrm{B} \left(23,0.5\right) \end{align} 二項分布の正規近似を行うと、漸近的に、 \begin{align} X \sim \mathrm{N} \left(11.5,5.75\right) \end{align} このとき検定統計量は、 \begin{align} Z&=\frac{X-np}{\sqrt{np \left(1-p\right)}}\\ &=\frac{X-23\times0.5}{\sqrt{23\times0.5\times0.5}}\\ &=\frac{7-11.5}{\sqrt{5.75}}\\ &=-1.877 \end{align} これを標準正規分布の下側2.5%点と比べると、 \begin{align} -z_{0.025}=-1.96 \lt -1.877=Z \end{align} したがって、帰無仮説は有意水準5%で棄却されないので、2つの検査法 $A$ と検査法 $B$ の真の感度に統計的な有意差があるとは言えないと結論づける。 $\blacksquare$
〔3〕多項分布の正規近似と分散・共分散行列
多項分布の期待値、分散、共分散は、 \begin{gather} E \left(X_i\right)=n\pi_i\\ V \left(X_i\right)=n\pi_i \left(1-\pi_i\right)\\ \mathrm{Cov} \left(X_i,X_j\right)=-n\pi_i\pi_j \end{gather} 問題文にあるように、多変量中心極限定理により、漸近的に \begin{align} \sqrt n \left(\boldsymbol{p}-\boldsymbol{\pi}\right) \sim \mathrm{MN} \left(\boldsymbol{0},\boldsymbol{\Sigma}\right) \end{align} このとき、分散・共分散行列は、 \begin{align} \boldsymbol{\Sigma}= \left(\begin{matrix}\pi_{++D} \left(1-\pi_{++D}\right)&-\pi_{++D} \cdot \pi_{+-D}& \cdots &-\pi_{++D} \cdot \pi_{--\bar{D}}\\-\pi_{+-D} \cdot \pi_{++D}&\pi_{+-D} \left(1-\pi_{+-D}\right)& \cdots &-\pi_{+-D} \cdot \pi_{--\bar{D}}\\\vdots&\vdots&\ddots&\vdots\\-\pi_{++D} \cdot \pi_{--\bar{D}}&\pi_{--\bar{D}} \cdot \pi_{\pm D}& \cdots &\pi_{--\bar{D}} \left(1-\pi_{--\bar{D}}\right)\\\end{matrix}\right) \end{align} 行列を用いると、 \begin{align} \boldsymbol{\Sigma}=\boldsymbol{D}-\boldsymbol{\pi}\boldsymbol{\pi}^\prime \end{align} ただし、行列 $\boldsymbol{D}$ は、$\boldsymbol{\pi}$ の各成分を対角要素にもつ対角行列である。 $\blacksquare$
〔4〕多変量のデルタ法
〔3〕の結果より、先ほどの統計量は、漸近的に8変量正規分布 \begin{align} \sqrt n \left(\boldsymbol{p}-\boldsymbol{\pi}\right) \sim \mathrm{N_8} \left(\boldsymbol{0},\boldsymbol{D}-\boldsymbol{\pi}\boldsymbol{\pi}^\prime\right) \end{align} ここで、問題文のような変数変換を行い、 \begin{gather} f \left(\boldsymbol{\pi}\right)=\frac{\pi_{+\bullet D}}{\pi_{\bullet +D}+\pi_{+\bullet \bar{D}}}-\frac{\pi_{\bullet +D}}{\pi_{\bullet +D}+\pi_{\bullet +\bar{D}}}\\ f \left(\boldsymbol{p}\right)=\frac{x_{+\bullet D}}{x_{\bullet +D}+x_{+\bullet \bar{D}}}-\frac{x_{\bullet +D}}{x_{\bullet +D}+x_{\bullet +\bar{D}}} \end{gather} 多変量のデルタ法を用いて $f \left(\boldsymbol{p}\right)$ を期待値 $E \left(\boldsymbol{p}\right)=\boldsymbol{\pi}$ まわりで近似すると、 偏導関数行列は、 \begin{align} \boldsymbol{H} \left(\boldsymbol{\pi}\right)= \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\} \end{align} 期待値と分散はそれぞれ、 \begin{align} E \left[\sqrt n \left\{f \left(\boldsymbol{p}\right)-f \left(\boldsymbol{\pi}\right)\right\}\right]\cong\sqrt n \left\{E \left[f \left(\boldsymbol{p}\right)\right]-E \left[f \left(\boldsymbol{\pi}\right)\right]\right\}=0 \end{align} \begin{align} V \left[\sqrt n \left\{f \left(\boldsymbol{p}\right)-f \left(\boldsymbol{\pi}\right)\right\}\right]&=V \left[\sqrt n f \left(\boldsymbol{p}\right)\right]+0\\ &= \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\}^\prime \left(\boldsymbol{D}-\boldsymbol{\pi}\boldsymbol{\pi}^\prime\right) \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\} \end{align} したがって、スラツキ―の定理により、漸近的に1変量正規分布 \begin{align} \sqrt n \left\{f \left(\boldsymbol{p}\right)-f \left(\boldsymbol{\pi}\right)\right\} \sim \mathrm{N} \left[0, \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\}^\prime \left(\boldsymbol{D}-\boldsymbol{\pi}\boldsymbol{\pi}^\prime\right) \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\}\right] \end{align} $\blacksquare$
〔5〕ワルド型検定の実施
〔4〕の結果より、漸近分散を以下のようにおくと、 \begin{gather} \sigma^2= \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\}^\prime \left(\boldsymbol{D}-\boldsymbol{\pi}\boldsymbol{\pi}^\prime\right) \left\{\frac{\partial f \left(\boldsymbol{\pi}\right)}{\partial\boldsymbol{\pi}}\right\}\\ \sqrt n \left\{f \left(\boldsymbol{p}\right)-f \left(\boldsymbol{\pi}\right)\right\} \sim \mathrm{N} \left(0,\sigma^2\right) \end{gather} これを標準化した値は、 \begin{align} Z=\frac{\sqrt n \left\{f \left(\boldsymbol{p}\right)-f \left(\boldsymbol{\pi}\right)\right\}}{\sigma} \sim \mathrm{N} \left(0,1\right) \end{align} 帰無仮説 $f \left(\boldsymbol{\pi}\right)=0$ における分布は、 \begin{align} Z_0=\frac{\sqrt n f \left(\boldsymbol{p}\right)}{\sigma} \sim \mathrm{N} \left(0,1\right) \end{align} 未知の $\boldsymbol{\pi}$ を $\boldsymbol{p}$ に置き換え、$\sigma$ を $\hat{\sigma}=\sqrt{0.42}$ で推定し、〔1〕の結果を用いると、検定統計量は、 \begin{align} Z_0&=\frac{\sqrt{200}}{\sqrt{0.42}} \left(0.8-0.9\right)\\ &\cong-2.18 \end{align} 〔2〕と同様に、これを標準正規分布の下側2.5%点と比べると、 \begin{align} Z_0=-2.18 \lt -1.96=-z_{0.025} \end{align} したがって、帰無仮説は有意水準5%で棄却され、2つの検査法 $A$ と検査法 $B$ の真の陽性的中率には有意差があると結論づける。 $\blacksquare$
0 件のコメント:
コメントを投稿