統計検定 1級 2022年 医薬生物学 問5 平均への回帰

公開日: 更新日:

【2022年11月3週】 【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2022年に実施された統計検定1級『医薬生物学』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕相関がある場合の期待値と分散

二変量正規分布の周辺分布であることから、 \begin{gather} X \sim \mathrm{N} \left(\mu_X,\sigma_X^2\right) \quad Y \sim \mathrm{N} \left(\mu_Y,\sigma_Y^2\right) \end{gather} すなわち、 \begin{gather} X \sim \mathrm{N} \left(120,144\right) \quad Y \sim \mathrm{N} \left(120,144\right) \end{gather} ここで相関係数の定義式より、 \begin{gather} \rho=\frac{\sigma_{XY}}{\sigma_X \cdot \sigma_Y}\\ \sigma_{XY}=\rho \cdot \sigma_X \cdot \sigma_Y \end{gather} ここから共分散を求めると、 \begin{gather} \sigma_{XY}=0.75 \cdot 12 \cdot 12=108 \end{gather} 期待値の性質より、 \begin{align} E \left(D\right)&=E \left(X-Y\right)\\ &=E \left(X\right)-E \left(Y\right)\\ &=120-120\\ &=0 \end{align} 分散の性質より、 \begin{align} V \left(D\right)&=V \left(X-Y\right)\\ &=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right)\\ &=144+144-2 \cdot 108\\ &=72 \end{align} 正規分布の再生性より、 \begin{gather} D \sim \mathrm{N} \left(0,72\right) \end{gather} このとき、 \begin{align} P \left(D \le -4\right)&=P \left(\frac{D-0}{\sqrt{72}} \le \frac{-4-0}{\sqrt{72}}\right)\\ &=P \left(Z \le -0.47\right)\\ &=0.3192 \end{align} $\blacksquare$

〔2〕条件付き分布

測定値 $Y$ の条件付き分布を求めるのに必要な値を求めると、 \begin{gather} \beta=\frac{\sigma_{XY}}{\sigma_X^2}=\frac{108}{144}=0.75\\ \alpha=\mu_Y-\beta\mu_X=120-0.75 \cdot 120=30\\ \sigma^2=\sigma_Y^2-\frac{\sigma_{XY}^2}{\sigma_X^2}=144-\frac{{108}^2}{144}=63 \end{gather} したがって、 \begin{align} E \left(Y\middle| X=132\right)&=\alpha+\beta x\\ &=30+0.75 \cdot 132\\ &=129 \end{align} \begin{align} V \left(Y\middle| X=132\right)&=\sigma^2\\ &=63 \end{align} \begin{gather} \left.Y\right|X=132 \sim \mathrm{N} \left(129,63\right) \end{gather} このとき、 \begin{align} P \left( \left.Y \le 128\right|X=132\right)&=P \left(\frac{Y-129}{\sqrt{63}} \le \frac{128-129}{\sqrt{63}}\right)\\ &=P \left(Z \le -0.13\right)\\ &=0.4483 \end{align}

平均への回帰とは、2回の測定 $ \left(X,Y\right)$ において、1回目の測定値 $x$ が平均 $\mu_X=E \left(X\right)$ よりも大きい(小さい)個体の2回目の測定値の期待値 $E \left(Y\middle| X=x\right)$ は $\mu_Y=E \left(Y\right)$ よりも大きい(小さい)ものの、差の絶対値 $ \left|E \left(Y\middle| X=x\right)-\mu_Y\right|$ は $ \left|x-\mu_X\right|$ よりも小さいことをいう。平均への回帰分は3 mmHg とみなされる。 $\blacksquare$

〔3〕変動効果モデル

問題の仮定から \begin{gather} \theta \sim \mathrm{N} \left(\mu,\tau^2\right) \quad \varepsilon_i \sim \mathrm{N} \left(0,\psi^2\right)\\ X=\theta+\varepsilon_1 \quad Y=\theta+\varepsilon_2 \end{gather} 正規分布の再生性より、 \begin{gather} X \sim \mathrm{N} \left(\mu,\tau^2+\psi^2\right) \quad Y \sim \mathrm{N} \left(\mu,\tau^2+\psi^2\right) \end{gather} したがって、 \begin{gather} V \left(X\right)=V \left(Y\right)=\tau^2+\psi^2 \end{gather} また、共分散の公式より、 \begin{align} \mathrm{Cov} \left(X,Y\right)&=E \left(XY\right)-E \left(X\right)E \left(Y\right)\\ &=E \left(XY\right)-\mu \cdot \mu\\ &=E \left(XY\right)-\mu^2 \end{align} ここで、 \begin{align} E \left(XY\right)&=E \left[ \left(\theta+\varepsilon_1\right) \left(\theta+\varepsilon_2\right)\right]\\ &=E \left[\theta^2+ \left(\varepsilon_1+\varepsilon_2\right)\theta+\varepsilon_1\varepsilon_2\right]\\ &=E \left(\theta^2\right)+E \left[ \left(\varepsilon_1+\varepsilon_2\right)\theta\right]+E \left(\varepsilon_1\varepsilon_2\right)\\ \end{align} 確率変数が独立なとき、$E \left(ab\right)=E \left(a\right)E \left(b\right)$ が成り立つので、 \begin{align} E \left(XY\right)&=E \left(\theta^2\right)+ \left\{E \left(\varepsilon_1\right)+E \left(\varepsilon_2\right)\right\}E \left(\theta\right)+E \left(\varepsilon_1\right)E \left(\varepsilon_2\right)\\ &=V \left(\theta\right)+ \left\{E \left(\theta\right)\right\}^2+ \left\{E \left(\varepsilon_1\right)+E \left(\varepsilon_2\right)\right\}E \left(\theta\right)+E \left(\varepsilon_1\right)E \left(\varepsilon_2\right)\\ &=\tau^2+\mu^2+ \left(0+0\right)\mu+0 \cdot 0\\ &=\tau^2+\mu^2 \end{align} したがって、 \begin{align} \mathrm{Cov} \left(X,Y\right)&=\tau^2+\mu^2-\mu^2\\ &=\tau^2 \end{align} これと〔1〕での計算から、 \begin{align} \tau^2=108 \end{align} \begin{gather} \tau^2+\psi^2=144\\ 108+\psi^2=144\\ \psi^2=36 \end{gather} $\blacksquare$

〔4〕変動効果モデルの下での条件付き分布

〔2〕の結果より、 \begin{gather} \left.Y\right|X=132 \sim \mathrm{N} \left(129,63\right)\\ \Leftrightarrow \left.\theta+\varepsilon_2\right|X=132 \sim \mathrm{N} \left(129,63\right) \end{gather} このとき、期待値と分散は、 \begin{gather} E \left(\theta+\varepsilon_2\middle| X=132\right)=E \left(\theta\middle| X=132\right)+E \left(\varepsilon_2\middle| X=132\right)\\ 129=E \left(\theta\middle| X=132\right)+0\\ E \left(\theta\middle| X=132\right)=129 \end{gather} \begin{gather} V \left(\theta+\varepsilon_2\middle| X=132\right)=V \left(\theta\middle| X=132\right)+V \left(\varepsilon_2\middle| X=132\right)\\ 63=V \left(\theta\middle| X=132\right)+36\\ V \left(\theta\middle| X=132\right)=27 \end{gather} 正規分布の線形変換の性質より、 \begin{align} \left.\theta\right|X=132 \sim \mathrm{N} \left(129,27\right) \end{align} $\blacksquare$

〔5〕変動効果モデルの下での2回目の測定値の分布

変動効果モデルの下で \begin{gather} \left.\theta\right|X=132 \sim \mathrm{N} \left(129,27\right) \quad \varepsilon_2 \sim \mathrm{N} \left(0,36\right)\\ Y=\theta+\varepsilon_2 \end{gather} 正規分布の再生性より、 \begin{gather} \left.Y\right|X=132 \sim \mathrm{N} \left(129,63\right) \end{gather}

$X=132$ の人の2回目の測定値 $Y$ の条件付き期待値が全平均に近づく理由は、1回目の測定値が $X=x \left( \gt \mu\right)$ となった人の真値 $\theta$ の分布は $x$ よりも小さな平均を持つ分布に従い、2回目の測定値はその $\theta$ の分布を反映しているためと言える。

このとき、 \begin{align} P \left( \left.Y \le 128\right|X=132\right)&=P \left(\frac{Y-129}{\sqrt{63}} \le \frac{128-129}{\sqrt{63}}\right)\\ &=P \left(Z \le -0.13\right)\\ &=0.4483 \end{align} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ