本稿には、2021年に実施された統計検定1級『医薬生物学』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕オッズ比の信頼区間の算出
オッズ比の推定値は、 \begin{align} \mathrm{\widehat{OR}}&=\frac{ad}{bc}\\ &=\frac{59\times65}{71\times60}\\ &\cong0.900 \end{align} 対数オッズ比の推定量の分散は、 \begin{align} V \left(\log{\mathrm{\widehat{OR}}}\right)&=\frac{1}{a}+\frac{1}{b}+\frac{1}{c}+\frac{1}{d}\\ &=\frac{1}{59}+\frac{1}{71}+\frac{1}{60}+\frac{1}{65}\\ &\cong0.063 \end{align} 対数オッズ比の推定量は漸近的に、 \begin{align} \log{\mathrm{\widehat{OR}}} \sim \mathrm{N} \left\{\log{\mathrm{OR}},V \left(\log{\mathrm{\widehat{OR}}}\right)\right\} \end{align} したがって、標準化した値を \begin{align} Z=\frac{\log{\mathrm{\widehat{OR}}}-\log{\mathrm{OR}}}{\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)}} \end{align} とすると、 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \end{align} 95%信頼区間 $-Z_{0.025} \le Z \le Z_{0.025}$ は、 \begin{align} \log{\mathrm{\widehat{OR}}}-Z_{0.025}\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)} \le \log{\mathrm{OR}} \le \log{\mathrm{\widehat{OR}}}+Z_{0.025}\sqrt{V \left(\log{\mathrm{\widehat{OR}}}\right)} \end{align} 各値を代入すると、 \begin{gather} \log{0.9}-1.96\sqrt{0.063} \le \log{\mathrm{OR}} \le \log{0.9}+1.96\sqrt{0.063}\\ \log{0.9}-0.49 \le \log{\mathrm{OR}} \le \log{0.9}+0.49\\ e^{\log{0.9}-0.49} \le \mathrm{OR} \le e^{\log{0.9}+0.49}\\ 0.9\times\frac{1}{e^{0.49}} \le \mathrm{OR} \le 0.9\times e^{0.49} \end{gather} 付表5 $e^{0.49}=1.6323$ より、 \begin{gather} 0.9\times\frac{1}{1.6323} \le \mathrm{OR} \le 0.9\times1.6323\\ 0.551 \le \mathrm{OR} \le 1.469 \end{gather} $\blacksquare$
〔2〕独立性の検定統計量の導出
[2-1]積二項尤度は、 \begin{align} L \left(\pi_1,\pi_2\right)&={}_{n_{1+}}C_{n_{11}}\pi_1^{n_{11}} \left(1-\pi_1\right)^{n_{1+}-n_{11}} \cdot {}_{n_{2+}}C_{n_{21}}\pi_2^{n_{21}} \left(1-\pi_2\right)^{n_{2+}-n_{21}}\\ &={}_{n_{1+}}C_{n_{11}}\pi_1^{n_{11}} \left(1-\pi_1\right)^{n_{12}} \cdot {}_{n_{2+}}C_{n_{21}}\pi_2^{n_{21}} \left(1-\pi_2\right)^{n_{22}} \end{align} [2-2]対数尤度関数は、 \begin{align} l \left(\pi_1,\pi_2\right)=\log{{}_{n_{1+}}C_{n_{11}}}+n_{11}\log{\pi_1}+n_{12}\log{ \left(1-\pi_1\right)}+\log{{}_{n_{2+}}C_{n_{21}}}+n_{21}\log{\pi_2}+n_{22}\log{ \left(1-\pi_2\right)} \end{align} スコア関数は、 \begin{align} U \left(\pi_1,\pi_2\right)=\frac{n_{11}}{\pi_1}-\frac{n_{12}}{1-\pi_1}+\frac{n_{21}}{\pi_2}-\frac{n_{22}}{1-\pi_2} \end{align} 帰無仮説 $H_0:\pi_1=\pi_2=\pi$ の元では、 \begin{align} U \left(\pi\right)=\frac{n_{11}+n_{21}}{\pi}-\frac{n_{12}+n_{22}}{1-\pi} \end{align} 尤度方程式 $U \left(\pi\right)=0$ を解くと、帰無仮説のもとでの最尤推定量は、 \begin{gather} \left(n_{11}+n_{21}\right) \left(1-\hat{\pi}\right)- \left(n_{12}+n_{22}\right)\hat{\pi}=0\\ \left(n_{11}+n_{21}\right)- \left(n_{11}+n_{21}\right)\hat{\pi}- \left(n_{12}+n_{22}\right)\hat{\pi}=0\\ \left(n_{11}+n_{21}+n_{12}+n_{22}\right)\hat{\pi}=n_{11}+n_{21}\\ \hat{\pi}=\frac{n_{11}+n_{21}}{N} \end{gather} [2-3]$n_{11}$ は帰無仮説のもとで \begin{align} n_{11} \sim \mathrm{B} \left(n_{1+},\pi\right) \end{align} 二項分布の期待値と分散の公式より、 \begin{align} E \left(n_{11}\right)=n_{1+}\pi \quad V \left(n_{11}\right)=n_{1+}\pi \left(1-\pi\right) \end{align} これを $\pi=\hat{\pi}$ で置き換えると、 \begin{gather} \hat{E} \left(n_{11}\right)=\frac{n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ \hat{V} \left(n_{11}\right)=\frac{n_{1+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2} \end{gather} 同様に、 \begin{gather} \hat{E} \left(n_{21}\right)=\frac{n_{2+} \left(n_{11}+n_{21}\right)}{N}\\ \hat{V} \left(n_{21}\right)=\frac{n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2} \end{gather} [2-4] \begin{align} n_{11}-\hat{E} \left(n_{11}\right)&=n_{11}-\frac{n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ &=\frac{n_{11} \left(n_{1+}+n_{2+}\right)-n_{1+} \left(n_{11}+n_{21}\right)}{N}\\ &=\frac{n_{11}n_{1+}+n_{11}n_{2+}-n_{11}n_{1+}-n_{1+}n_{21}}{N}\\ &=\frac{n_{2+}n_{11}-n_{1+}n_{21}}{N} \end{align} この分散を取ると、 \begin{align} \hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]&=V \left(\frac{n_{2+}n_{11}-n_{1+}n_{21}}{N}\right)\\ &=V \left(\frac{n_{2+}}{N}n_{11}-\frac{n_{1+}}{N}n_{21}\right)\\ &=\frac{n_{2+}^2}{N^2}\hat{V} \left(n_{11}\right)+\frac{n_{1+}^2}{N^2}\hat{V} \left(n_{21}\right)\\ &=\frac{n_{2+}^2}{N^2}\frac{n_{1+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2}+\frac{n_{1+}^2}{N^2}\frac{n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^2}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right) \left(n_{1+}+n_{2+}\right)}{N^4}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)N}{N^4}\\ &=\frac{n_{1+}n_{2+} \left(n_{11}+n_{21}\right) \left(n_{12}+n_{22}\right)}{N^3} \end{align} 表3の数値を代入すると、 \begin{gather} n_{11}-\hat{E} \left(n_{11}\right)=\frac{125\times59-130\times60}{255}=-1.667\\ \hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]=\frac{130\times125\times119\times136}{{255}^3}=15.861 \end{gather} したがって、検定統計量は、 \begin{align} X=\frac{ \left(-1.667\right)^2}{15.861}=0.175 \end{align} この検定統計量は、自由度1の $\chi^2$分布に従い、$\chi_{0.05}^2 \left(1\right)=3.84$ より、 \begin{align} X \lt \chi_{0.05}^2 \left(1\right) \end{align} なので、5%水準で有意ではない。 $\blacksquare$
〔3〕Cochran検定統計量の導出
問題で与えられた帰無仮説 $H_0:\psi_1=\psi_2= \cdots =\psi_K=1$ は、第 $k$ 層目においては、 \begin{align} H_0:\pi_{1k}=\pi_{2k}=\pi_k \end{align} と同値である。 [3-1]二項分布の正規近似により、漸近的に、 \begin{align} n_{11k} \sim \mathrm{N} \left\{n_{1+k}\pi_{1k},n_{1+k}\pi_{1k} \left(1-\pi_{1k}\right)\right\} \end{align} 線形変換の性質により、 \begin{align} Y_k=n_{11k}-\hat{E} \left(n_{11k}\right) \sim N \left\{0,V \left[n_{11}-\hat{E} \left(n_{11}\right)\right]\right\} \end{align} 分散の推定量を代入すると、 \begin{align} Y_k \sim \mathrm{N} \left\{0,\hat{V} \left[n_{11}-\hat{E} \left(n_{11}\right)\right]\right\} \end{align} [3-2]正規分布の再生性により、$Y_1,Y_2, \cdots ,Y_K$ が互いに独立であるとすると、$Y=Y_1+Y_2+ \cdots +Y_K$ は、 \begin{align} Y \sim \mathrm{N} \left\{0,\sum_{k=1}^{K}{\hat{V} \left[Y_k\right]}\right\} \end{align} よって、 \begin{align} Z=\frac{\sum_{k=1}^{K} \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}}{\sqrt{\sum_{k=1}^{K}V \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}}} \sim \mathrm{N} \left\{0,1\right\} \end{align} したがって、Cochran検定統計量は、これを2乗して、 \begin{align} \chi_C^2&=\frac{ \left[\sum_{k=1}^{K} \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}\right]^2}{\sum_{k=1}^{K}V \left\{n_{11k}-\hat{E} \left(n_{11k}\right)\right\}} \end{align} これは、自由度1の $\chi^2$分布に従う。 $\blacksquare$
〔4〕層調整済み解析の実施
表5の各数値を代入すると、 \begin{align} \chi_C^2&=\frac{ \left[\frac{100\times25-30\times55}{130}+\frac{25\times34-100\times5}{125}\right]^2}{\frac{30\times100\times \left(25+55\right) \left(5+45\right)}{{130}^3}+\frac{100\times25\times \left(34+5\right) \left(66+20\right)}{{125}^3}}\\ &=\frac{ \left(6.538+2.800\right)^2}{5.462+4.293}\\ &=8.939 \end{align} $\chi_{0.05}^2 \left(1\right)=3.84$ より、$\chi_{0.05}^2 \left(1\right) \lt \chi_C^2$ なので、5%水準で有意である。これは、〔2〕の結果と異なっているが、これは、男性は既存治療に割り当てられる確率が高く、女性は新規治療に割り当てられる確率が高いなど、交絡が発生していたためであり、交絡因子の影響が取り除かれた結果であると考えられる。 $\blacksquare$
0 件のコメント:
コメントを投稿