本稿には、2024年に実施された統計検定1級『医薬生物学』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 統計検定の問題の使用に関する規約により禁止されているため、問題文は掲載することができません。公式サイトで公開されているものなどをご参照ください。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕独立性の検定
$T$ 群 | $C$ 群 | 合計 | |
---|---|---|---|
データあり | $70$ | $90$ | $160$ |
データなし | $30$ | $10$ | $40$ |
合計 | $100$ | $100$ | $200$ |
独立性の検定の検定統計量の公式より、 \begin{align} \chi^2&=\frac{200 \left(70 \cdot 10-30 \cdot 90\right)^2}{160 \cdot 40 \cdot 100 \cdot 100}\\ &=12.5 \end{align} 付表3より、 \begin{align} \chi_{0.05}^2=3.84 \lt 12.5=\chi^2 \end{align} となるため、 治療群の種類と欠測が独立であるという帰無仮説は棄却される。 $\blacksquare$
〔2〕改善割合の差の分散の推定値
各データに対する標本比率の分散は、 \begin{align} V \left(p\right)=\frac{p \left(1-p\right)}{n} \end{align} 改善割合の差の分散は、試験治療群のデータと対照治療群のデータが互いに独立であることから、 \begin{align} V \left(p_{Ti}-p_{Ci}\right)&=V \left(p_{Ti}\right)+V \left(p_{Ci}\right)\\ &=\frac{p_{Ti} \left(1-p_{Ti}\right)}{n_{Ti}}+\frac{p_{Ci} \left(1-p_{Ci}\right)}{n_{Ci}} \end{align} 標本比率で母比率を置き換えると、 \begin{align} \hat{V} \left(p_{Ti}-p_{Ci}\right)&=V \left(p_{Ti}\right)+V \left(p_{Ci}\right)\\ &=\frac{{\hat{p}}_{Ti} \left(1-{\hat{p}}_{Ti}\right)}{n_{Ti}}+\frac{{\hat{p}}_{Ci} \left(1-{\hat{p}}_{Ci}\right)}{n_{Ci}} \end{align} 具体的な値を計算すると、 \begin{align} \hat{V} \left(p_{T1}-p_{C1}\right)&=\frac{0.28 \cdot 0.72}{100}+\frac{0.22 \cdot 0.78}{100}\\ &=0.002016+0.001716\\ &=0.003732 \end{align} \begin{align} \hat{V} \left(p_{T2}-p_{C2}\right)&=\frac{0.30 \cdot 0.70}{100}+\frac{0.23 \cdot 0.77}{100}\\ &=0.0021+0.001771\\ &=0.003871 \end{align} $\blacksquare$
〔3〕「ルービンのルール」による分散の統合
表1と〔2〕の結果より、問題文で与えられたとおりに計算すると、 \begin{align} \bar{\theta}&=\frac{0.06+0.07+0.08}{3}\\ &=0.07 \end{align} \begin{align} W&=\frac{0.003732+0.003871+0.003718}{3}\\ &=0.003773667 \end{align} \begin{align} B&=\frac{ \left(0.06-0.07\right)^2+ \left(0.07-0.07\right)^2+ \left(0.08-0.07\right)^2}{2}\\ &=\frac{0.0001+0+0.0001}{2}\\ &=0.0001 \end{align} \begin{align} V \left(\bar{\theta}\right)&=0.003773667+ \left(1+\frac{1}{3}\right)\times0.0001\\ &=0.003773667+0.000133\\ &\cong0.003907 \end{align} $\blacksquare$
〔4〕補完データセットにもとづく推定量の分散
問題文の条件から、$Y_T^o=y_T^o,Y_C^o=y_C^o$ が与えられた条件下での $Y_{Tk}^m,Y_{Ck}^m$ の条件付き分布は、 \begin{align} Y_{Tk}^m \sim \mathrm{B} \left(M_T,\frac{y_T^o}{N_T}\right)\\ Y_{Ck}^m \sim \mathrm{B} \left(M_C,\frac{y_C^o}{N_C}\right) \end{align} 二項分布の分散の公式より、与条件下での条件付き分散は、 \begin{align} V \left(Y_{Tk}^m\middle| y_T^o\right)&=M_T \cdot \frac{y_T^o}{N_T} \cdot \left(1-\frac{y_T^o}{N_T}\right)\\ &=M_T \cdot \frac{y_T^o}{N_T} \cdot \frac{N_T-y_T^o}{N_T} \end{align} \begin{align} V \left(Y_{Ck}^m\middle| y_C^o\right)&=M_C \cdot \frac{y_C^o}{N_C} \cdot \left(1-\frac{y_C^o}{N_C}\right)\\ &=M_C \cdot \frac{y_C^o}{N_C} \cdot \frac{N_C-y_C^o}{N_C} \end{align} \begin{align} \mathrm{Cov} \left(Y_{Ck}^m,Y_{Ck}^m\middle| y_T^o,y_C^o\right)=0 \end{align} したがって、分散の公式より、 \begin{align} V \left({\hat{\theta}}_k\middle|\ y_T^o,y_C^o\right)&=V \left(\frac{y_T^o+Y_{Tk}^m}{N_T+M_T}-\frac{y_C^o+Y_{Ck}^m}{N_C+M_C}\right)\\ &=\frac{1}{ \left(N_T+M_T\right)^2}V \left(Y_{Tk}^m\middle| y_T^o\right)+\frac{1}{ \left(N_C+M_C\right)^2}V \left(Y_{Ck}^m\middle| y_C^o\right)\\ &=\frac{M_T \cdot y_T^o \left(N_T-y_T^o\right)}{ \left\{N_T \left(N_T+M_T\right)\right\}^2}+\frac{M_C \cdot y_C^o \left(N_C-y_C^o\right)}{ \left\{N_C \left(N_C+M_C\right)\right\}^2} \end{align} $\blacksquare$
〔5〕補完データセットにもとづく補完間分散の期待値
改善割合の差の推定量 ${\hat{\theta}}_k$ をある分布に従う確率変数と見ると、$\bar{\theta}$ は標本平均、補完間分散 $B$ は標本不偏分散に相当する統計量である。したがって、標本不偏分散の性質より、 \begin{align} E \left(B\middle|\ y_T^o,y_C^o\right)&=V \left({\hat{\theta}}_k\middle|\ y_T^o,y_C^o\right)\\ &=\frac{M_T \cdot y_T^o \left(N_T-y_T^o\right)}{ \left\{N_T \left(N_T+M_T\right)\right\}^2}+\frac{M_C \cdot y_C^o \left(N_C-y_C^o\right)}{ \left\{N_C \left(N_C+M_C\right)\right\}^2} \end{align} $\blacksquare$
0 件のコメント:
コメントを投稿