本稿には、2017年に実施された統計検定1級『医薬生物学』 問4の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕曝露オッズ比の推定値
曝露オッズの定義式より、ケース群とコントロール群の曝露オッズは、それぞれ \begin{align} O_{Case}=\frac{y_{11k}}{y_{12k}} \quad O_{Cont}=\frac{y_{21k}}{y_{22k}} \end{align} 曝露オッズ比の定義式より、 \begin{align} OR=\frac{O_{Case}}{O_{Cont}}=\frac{y_{11k}}{y_{12k}}\times\frac{y_{22k}}{y_{21k}} \end{align} これを各年齢層で計算すると、 \begin{gather} \psi_1=\frac{5}{5}\times\frac{270}{35}\cong7.71\\ \psi_2=\frac{67}{55}\times\frac{277}{56}\cong6.03\\ \psi_3=\frac{6}{11}\times\frac{119}{18}\cong3.61 \end{gather} $\blacksquare$
〔2〕層別オッズ比の推定値
年齢層に分割表を整理しなおすと、以下のようになる。
25-44歳 | 発症あり | 発症なし | 合計 |
---|---|---|---|
曝露あり | $5$ | $35$ | $40$ |
曝露なし | $5$ | $270$ | $275$ |
合計 | $10$ | $305$ | $315$ |
45-64歳 | 発症あり | 発症なし | 合計 |
---|---|---|---|
曝露あり | $67$ | $56$ | $123$ |
曝露なし | $55$ | $277$ | $332$ |
合計 | $122$ | $333$ | $455$ |
65歳以上 | 発症あり | 発症なし | 合計 |
---|---|---|---|
曝露あり | $24$ | $18$ | $42$ |
曝露なし | $44$ | $119$ | $163$ |
合計 | $68$ | $137$ | $205$ |
与えられた式を用いてそれぞれの値を算出すると、
(i)25~44歳
\begin{gather}
y_{111}=5\\
E \left(y_{111}\right)=\frac{ \left(5+5\right) \left(5+35\right)}{315}\cong1.27\\
V \left(y_{111}\right)=\frac{ \left(5+5\right) \left(35+270\right) \left(5+35\right) \left(5+270\right)}{315\times315\times \left(315-1\right)}\cong1.08\\
\log{{\hat{\psi}}_1}=\frac{5-1.27}{1.08}=3.45\\
{\hat{\psi}}_1=e^{3.45}=31.62
\end{gather}
(ii)45~64歳
\begin{gather}
y_{112}=67\\
E \left(y_{112}\right)=\frac{ \left(67+55\right) \left(67+56\right)}{455}\cong32.98\\
V \left(y_{112}\right)=\frac{ \left(67+55\right) \left(56+277\right) \left(67+56\right) \left(55+277\right)}{455\times455\times \left(455-1\right)}\cong17.65\\
\log{{\hat{\psi}}_2}=\frac{67-32.98}{17.65}=1.93\\
{\hat{\psi}}_2=e^{1.93}=6.87
\end{gather}
(iii)65歳~
\begin{gather}
y_{113}=24\\
E \left(y_{113}\right)=\frac{ \left(24+44\right) \left(24+18\right)}{205}\cong13.93\\
V \left(y_{113}\right)=\frac{ \left(24+44\right) \left(18+119\right) \left(24+18\right) \left(44+119\right)}{205\times205\times \left(205-1\right)}\cong7.44\\
\log{{\hat{\psi}}_3}=\frac{24-13.93}{7.44}=1.35\\
{\hat{\psi}}_3=e^{1.35}=3.87
\end{gather}
$\blacksquare$
〔3〕共通オッズ比の推定値と対数オッズ比の重み付き平均の分散
対数オッズの重みつき平均を $E \left(Y\right)=\bar{Y}$ とすると、 \begin{align} \bar{Y}&=\frac{\sum_{k=1}^{3}{V \left(y_{11k}\right) \cdot \log{{\hat{\psi}}_k}}}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\\ &=\frac{\sum_{k=1}^{3}{V \left(y_{11k}\right) \cdot \frac{y_{11k}-E \left(y_{11k}\right)}{V \left(y_{11k}\right)}}}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\\ &=\frac{\sum_{k=1}^{3} \left\{y_{11k}-E \left(y_{11k}\right)\right\}}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\\ &=\frac{\sum_{k=1}^{3}y_{11k}-\sum_{k=1}^{3}E \left(y_{11k}\right)}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\\ &=\frac{ \left(5+67+24\right)- \left(1.27+32.98+13.93\right)}{1.08+17.65+7.44}\\ &=1.83 \end{align} これより、共通オッズ比 $\psi$ の推定値は、 \begin{align} \hat{\psi}&=e^{1.83}\\ &=e \cdot e^{0.83}\\ &=2.7183\times2.2933\\ &=6.23 \end{align} また、重みつき平均の分散は、 \begin{align} V \left(\bar{Y}\right)=V \left[\frac{\sum_{k=1}^{3}y_{11k}-\sum_{k=1}^{3}E \left(y_{11k}\right)}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\right] \end{align} ここで、確率変数は $y_{11k}$、$E \left(y_{11k}\right),V \left(y_{11k}\right)$ は定数であるから、 \begin{align} V \left(\bar{Y}\right)&= \left\{\frac{1}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\right\}^2V \left\{\sum_{k=1}^{3}y_{11k}-\sum_{k=1}^{3}E \left(y_{11k}\right)\right\}\\ &= \left\{\frac{1}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\right\}^2 \left[V \left(\sum_{k=1}^{3}y_{11k}\right)+V \left\{\sum_{k=1}^{3}E \left(y_{11k}\right)\right\}\right]\\ &= \left\{\frac{1}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\right\}^2V \left(\sum_{k=1}^{3}y_{11k}\right) \end{align} 分散の性質 $V \left(\sum_{k=1}^{3}y_{11k}\right)=\sum_{k=1}^{3}V \left(y_{11k}\right)$ より、 \begin{align} V \left(\bar{Y}\right)&= \left\{\frac{1}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\right\}^2\sum_{k=1}^{3}V \left(y_{11k}\right)\\ &=\frac{1}{\sum_{k=1}^{3}V \left(y_{11k}\right)}\\ &=\frac{1}{1.08+17.65+7.44}\\ &=0.04 \end{align} $\blacksquare$
〔4〕共通オッズ比の信頼区間
対数オッズ比の推定量 $\bar{Y}=\log{\hat{\psi}}$ は、漸近的に \begin{align} \bar{Y} \sim \mathrm{N} \left\{\log{\psi},V \left(\log{\hat{\psi}}\right)\right\} \end{align} このとき、95%信頼区間は、 \begin{gather} \log{\hat{\psi}}-z_{0.025} \cdot \sqrt{V \left(\log{\hat{\psi}}\right)} \le \log{\psi} \le \log{\hat{\psi}}+z_{0.025} \cdot \sqrt{V \left(\log{\hat{\psi}}\right)}\\ 1.83-1.96\sqrt{0.04} \le \log{\psi} \le 1.83+1.96\sqrt{0.04}\\ 1.45 \le \log{\psi} \le 2.21 \end{gather} したがって、共通オッズの95%信頼区間は、 \begin{gather} e^{1.45} \le \psi \le e^{2.21}\\ 4.25 \le \psi \le 9.14 \end{gather} 信頼区間の下限値が1よりも大きいため、アルコールの摂取量とある癌の発症には関係があるといえる。 $\blacksquare$
〔5〕オッズ比の均一性の検定
対数オッズ比は近似的に正規分布に従うことから、その正規分布の母平均の均一性の検定(分散分析や多重比較)に持ち込むことが考えられる。また、Breslow-Day検定の適用も選択肢の1つとなる。 $\blacksquare$
0 件のコメント:
コメントを投稿