統計検定 1級 2021年 医薬生物学 問3 層別解析(コクラン検定)

公開日: 更新日:

【2023年2月2週】 【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2021年に実施された統計検定1級『医薬生物学』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕オッズ比の信頼区間の算出

オッズ比の推定値は、 \begin{align} \mathrm{\widehat{OR}}&=\frac{ad}{bc}\\ &=\frac{59\times65}{71\times60}\\ &\cong0.900 \end{align} 対数オッズ比の推定量の分散は、 \begin{align} V \left(\log{\mathrm{\widehat{OR}}}\right)&=\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}\\ &=\frac{1}{59}+\frac{1}{71}+\frac{1}{60}+\frac{1}{65}\\ &\cong0.063 \end{align} 対数オッズ比の推定量は漸近的に、 \begin{align} \log{\mathrm{\widehat{OR}}} \sim \mathrm{N} \left\{\log{\mathrm{OR}},V \left(\log{\mathrm{\widehat{OR}}}\right)\right\} \end{align} したがって、標準化した値を \begin{align} Z=\frac{\log{\mathrm{\widehat{OR}}}-\log{\mathrm{OR}}}{\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)}} \end{align} とすると、 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} 95%信頼区間 $-Z_{0.025} \le Z \le Z_{0.025}$ は、 \begin{align} \log{\mathrm{\widehat{OR}}}-Z_{0.025}\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)} \le \log{\mathrm{OR}} \le \log{\mathrm{\widehat{OR}}}+Z_{0.025}\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)} \end{align} 各値を代入すると、 \begin{gather} \log{0.9}-1.96\sqrt{0.063} \le \log{\mathrm{OR}} \le \log{0.9}+1.96\sqrt{0.063}\\ \log{0.9}-0.49 \le \log{\mathrm{OR}} \le \log{0.9}+0.49\\ e^{\log{0.9}-0.49} \le \mathrm{OR} \le e^{\log{0.9}+0.49}\\ 0.9\times\frac{1}{e^{0.49}} \le \mathrm{OR} \le 0.9\times e^{0.49} \end{gather} 付表5 $e^{0.49}=1.6323$ より、 \begin{gather} 0.9\times\frac{1}{1.6323} \le \mathrm{OR} \le 0.9\times1.6323\\ 0.551 \le \mathrm{OR} \le 1.469 \end{gather} $\blacksquare$

〔2〕独立性の検定統計量の導出

[2-1]積二項尤度は、 \begin{align} L \left(\pi_1,\pi_2\right)&={}_{n_{1+}}C_{n_{11}}\pi_1^{n_{11}} \left(1-\pi_1\right)^{n_{1+}-n_{11}} \cdot {}_{n_{2+}}C_{n_{21}}\pi_2^{n_{21}} \left(1-\pi_2\right)^{n_{2+}-n_{21}}\\ &={}_{n_{1+}}C_{n_{11}}\pi_1^{n_{11}} \left(1-\pi_1\right)^{n_{12}} \cdot {}_{n_{2+}}C_{n_{21}}\pi_2^{n_{21}} \left(1-\pi_2\right)^{n_{22}} \end{align} [2-2]対数尤度関数は、 \begin{align} l \left(\pi_1,\pi_2\right)=\log{{}_{n_{1+}}C_{n_{11}}}+n_{11}\log{\pi_1}+n_{12}\log{ \left(1-\pi_1\right)}+\log{{}_{n_{2+}}C_{n_{21}}}+n_{21}\log{\pi_2}+n_{22}\log{ \left(1-\pi_2\right)} \end{align} スコア関数は、 \begin{align} U \left(\pi_1,\pi_2\right)=\frac{n_{11}}{\pi_1}-\frac{n_{12}}{1-\pi_1}+\frac{n_{21}}{\pi_2}-\frac{n_{22}}{1-\pi_2} \end{align} 帰無仮説 $H_0:\pi_1=\pi_2=\pi$ の元では、 \begin{align} U \left(\pi\right)=\frac{n_{11}+n_{21}}{\pi}-\frac{n_{12}+n_{22}}{1-\pi} \end{align} 尤度方程式 $U \left(\pi\right)=0$ を解くと、帰無仮説のもとでの最尤推定量は、 \begin{gather} \left(n_{11}+n_{21}\right) \left(1-\hat{\pi}\right)- \left(n_{12}+n_{22}\right)\hat{\pi}=0\\ \left(n_{11}+n_{21}\right)- \left(n_{11}+n_{21}\right)\hat{\pi}- \left(n_{12}+n_{22}\right)\hat{\pi}=0\\ \left(n_{11}+n_{21}+n_{12}+n_{22}\right)\hat{\pi}=n_{11}+n_{21}\\ \hat{\pi}=\frac{n_{11}+n_{21}}{N} \end{gather} [2-3]$n_{11}$ は帰無仮説のもとで \begin{align} n_{11} \sim \mathrm{B} \left(n_{1+},\pi\right) \end{align} 二項分布の期待値と分散の公式より、 \begin{align} E \left(n_{11}\right)=n_{1+}\pi \quad V \left(n_{11}\right)=n_{1+}\pi \left(1-\pi\right) \end{align} これを $\pi=\hat{\pi}$ で置き換えると、 \begin{gather} \hat{E} \left(n_{11}\right)=\frac{n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ \hat{V} \left(n_{11}\right)=\frac{n_{1+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2} \end{gather} 同様に、 \begin{gather} \hat{E} \left(n_{21}\right)=\frac{n_{2+} \left(n_{11}+n_{21}\right)}{N}\\ \hat{V} \left(n_{21}\right)=\frac{n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2} \end{gather} [2-4] \begin{align} n_{11}-\hat{E} \left(n_{11}\right)&=n_{11}-\frac{n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ &=\frac{n_{11} \left(n_{1+}+n_{2+}\right)-n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ &=\frac{n_{11}n_{1+}+n_{11}n_{2+}-n_{11}n_{1+}-n_{1+}n_{21}}{N}\\ &=\frac{n_{2+}n_{11}-n_{1+}n_{21}}{N} \end{align} この分散を取ると、 \begin{align} \hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]&=V \left(\frac{n_{2+}n_{11}-n_{1+}n_{21}}{N}\right)\\ &=V \left(\frac{n_{2+}}{N}n_{11}-\frac{n_{1+}}{N}n_{21}\right)\\ &=\frac{n_{2+}^2}{N^2}\hat{V} \left(n_{11}\right)+\frac{n_{1+}^2}{N^2}\hat{V} \left(n_{21}\right)\\ &=\frac{n_{2+}^2}{N^2}\frac{n_{1+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2}+\frac{n_{1+}^2}{N^2}\frac{n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right) \left(n_{1+}+n_{2+}\right)}{N^4}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)N}{N^4}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^3} \end{align} 表3の数値を代入すると、 \begin{gather} n_{11}-\hat{E} \left(n_{11}\right)=\frac{125\times59-130\times60}{255}=-1.667\\ \hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]=\frac{130\times125\times119\times136}{{255}^3}=15.861 \end{gather} したがって、検定統計量は、 \begin{align} X=\frac{ \left(-1.667\right)^2}{15.861}=0.175 \end{align} この検定統計量は、自由度1の $\chi^2$分布に従い、$\chi_{0.05}^2 \left(1\right)=3.84$ より、 \begin{align} X \lt \chi_{0.05}^2 \left(1\right) \end{align} なので、5%水準で有意ではない。 $\blacksquare$

〔3〕Cochran検定統計量の導出

問題で与えられた帰無仮説 $H_0:\psi_1=\psi_2= \cdots =\psi_K=1$ は、第 $k$ 層目においては、 \begin{align} H_0:\pi_{1k}=\pi_{2k}=\pi_k \end{align} と同値である。 [3-1]二項分布の正規近似により、漸近的に、 \begin{align} n_{11k} \sim \mathrm{N} \left\{n_{1+k}\pi_{1k},n_{1+k}\pi_{1k} \left(1-\pi_{1k}\right)\right\} \end{align} 線形変換の性質により、 \begin{align} Y_k=n_{11k}-\hat{E} \left(n_{11k}\right) \sim N \left\{0,V \left[n_{11}-\hat{E} \left(n_{11}\right)\right]\right\} \end{align} 分散の推定量を代入すると、 \begin{align} Y_k \sim \mathrm{N} \left\{0,\hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]\right\} \end{align} [3-2]正規分布の再生性により、$Y_1,Y_2, \cdots ,Y_K$ が互いに独立であるとすると、$Y=Y_1+Y_2+ \cdots +Y_K$ は、 \begin{align} Y \sim \mathrm{N} \left\{0,\sum_{k=1}^{K}{\hat{V} \left[Y_k\right]}\right\} \end{align} よって、 \begin{align} Z=\frac{\sum_{k=1}^{K} \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}}{\sqrt{\sum_{k=1}^{K}V \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}}} \sim \mathrm{N} \left\{0,1\right\} \end{align} したがって、Cochran検定統計量は、これを2乗して、 \begin{align} \chi_C^2&=\frac{ \left[\sum_{k=1}^{K} \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}\right]^2}{\sum_{k=1}^{K}V \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}} \end{align} これは、自由度1の $\chi^2$分布に従う。 $\blacksquare$

〔4〕層調整済み解析の実施

表5の各数値を代入すると、 \begin{align} \chi_C^2&=\frac{ \left[\frac{100\times25-30\times55}{130}+\frac{25\times34-100\times5}{125}\right]^2}{\frac{30\times100\times \left(25+55\right) \left(5+45\right)}{{130}^3}+\frac{100\times25\times \left(34+5\right) \left(66+20\right)}{{125}^3}}\\ &=\frac{ \left(6.538+2.800\right)^2}{5.462+4.293}\\ &=8.939 \end{align} $\chi_{0.05}^2 \left(1\right)=3.84$ より、$\chi_{0.05}^2 \left(1\right) \lt \chi_C^2$ なので、5%水準で有意である。これは、〔2〕の結果と異なっているが、これは、男性は既存治療に割り当てられる確率が高く、女性は新規治療に割り当てられる確率が高いなど、交絡が発生していたためであり、交絡因子の影響が取り除かれた結果であると考えられる。 $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

QooQ