本稿には、2017年に実施された統計検定1級『医薬生物学』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕方法1でグループAに振り分けられる学生数の期待値と分散
与えられた条件のもとで、グループAに振り分けられた学生の数 $X$ は、 \begin{align} X \sim \mathrm{B} \left(5,\frac{1}{2}\right) \end{align} よって、二項分布の確率関数より、 \begin{align} P \left(X=3\right)&={}_{5}C_3 \cdot \left(\frac{1}{2}\right)^3 \cdot \left(\frac{1}{2}\right)^2\\ &=\frac{5 \cdot 4 \cdot 3}{3 \cdot 2} \cdot \left(\frac{1}{2}\right)^5\\ &=\frac{5}{16} \end{align} 二項分布の期待値と分散の公式より、 \begin{gather} E \left(X\right)=np=5 \cdot \frac{1}{2}=\frac{5}{2}\\ V \left(X\right)=np \left(1-p\right)=5 \cdot \frac{1}{2} \cdot \frac{1}{2}=\frac{5}{4} \end{gather} $\blacksquare$
〔2〕方法2でグループAに振り分けられる学生数の期待値と分散
このルールのもとでは、2人目までは必ずAとBに1人ずつ振り分けられる。3番目、4番目、5番目の振り分け結果を $ \left(C_3,C_4,C_5\right)$ とすると、そのときの $Y$ の値とその確率は以下のようになる。
\begin{gather}
\left(A,A,A\right)\rightarrow P \left(Y=4\right)=\frac{1}{2}\times\frac{1}{3}\times\frac{1}{4}=\frac{1}{24}\\
\left(A,B,A\right)\rightarrow P \left(Y=3\right)=\frac{1}{2}\times\frac{2}{3}\times\frac{2}{4}=\frac{4}{24}\\
\left(B,A,A\right)\rightarrow P \left(Y=3\right)=\frac{1}{2}\times\frac{2}{3}\times\frac{2}{4}=\frac{4}{24}\\
\left(B,B,A\right)\rightarrow P \left(Y=2\right)=\frac{1}{2}\times\frac{1}{3}\times\frac{3}{4}=\frac{3}{24}\\
\left(A,A,B\right)\rightarrow P \left(Y=3\right)=\frac{1}{2}\times\frac{1}{3}\times\frac{3}{4}=\frac{3}{24}\\
\left(A,B,B\right)\rightarrow P \left(Y=2\right)=\frac{1}{2}\times\frac{2}{3}\times\frac{2}{4}=\frac{4}{24}\\
\left(B,A,B\right)\rightarrow P \left(Y=2\right)=\frac{1}{2}\times\frac{2}{3}\times\frac{2}{4}=\frac{4}{24}\\
\left(B,B,B\right)\rightarrow P \left(Y=1\right)=\frac{1}{2}\times\frac{1}{3}\times\frac{1}{4}=\frac{1}{24}
\end{gather}
これより、$Y$ の値とその確率はそれぞれ、
\begin{gather}
P \left(Y=4\right)=\frac{1}{24}\\
P \left(Y=3\right)=\frac{3}{24}+\frac{4}{24}+\frac{4}{24}=\frac{11}{24}\\
P \left(Y=2\right)=\frac{4}{24}+\frac{4}{24}+\frac{3}{24}=\frac{11}{24}\\
P \left(Y=1\right)=\frac{1}{24}
\end{gather}
(i)期待値
期待値の定義式 $E \left(Y\right)=\sum_{y=-\infty}^{\infty}{y \cdot f \left(y\right)}$ より、
\begin{align}
E \left(Y\right)&=4 \cdot \frac{1}{24}+3 \cdot \frac{11}{24}+2 \cdot \frac{11}{24}+1 \cdot \frac{1}{24}\\
&=\frac{60}{24}\\
&=\frac{5}{2}
\end{align}
(ii)分散
2乗の期待値の定義式 $E \left(Y^2\right)=\sum_{y=-\infty}^{\infty}{y^2 \cdot f \left(y\right)}$ より、
\begin{align}
E \left(Y^2\right)&=16 \cdot \frac{1}{24}+9 \cdot \frac{11}{24}+4 \cdot \frac{11}{24}+1 \cdot \frac{1}{24}\\
&=\frac{160}{24}\\
&=\frac{20}{3}
\end{align}
分散の公式 $V \left(Y\right)=E \left(Y^2\right)- \left\{E \left(Y\right)\right\}^2$ より、
\begin{align}
V \left(Y\right)&=\frac{20}{3}-\frac{25}{4}\\
&=\frac{80-75}{12}\\
&=\frac{5}{12}
\end{align}
$\blacksquare$
〔3〕方法1と方法2の期待値・分散の大小関係
一般の $n$ について、$X$ は、 \begin{align} X \sim \mathrm{B} \left(n,\frac{1}{2}\right) \end{align} 二項分布の期待値と分散の公式より、 \begin{gather} E \left(X\right)=\frac{n}{2}\\ V \left(X\right)=\frac{n}{4} \end{gather} $Y$ の分布は左右対称であることから、期待値は取り得る値 $1$ から $n-1$ の中点であるので \begin{align} E \left(Y\right)=\frac{1+n-1}{2}=\frac{n}{2} \end{align} したがって、 \begin{align} E \left(X\right)=E \left(Y\right) \end{align} 方法2は両グループの人数を同じにする方向に学生を割り当てるので、平均値から離れた値を取る確率が方法1よりも小さくなる。したがって、分徴の定義式 $V \left(Y\right)=\sum_{y=1}^{n-1}{ \left\{y-E \left(Y\right)\right\}^2 \cdot f \left(y\right)}$ より、 \begin{align} E \left(Y\right) \lt E \left(X\right) \end{align} $\blacksquare$
〔4〕信頼区間の幅の比
グループAに振り分けられた96人の学生のテストの点数を \begin{align} T_{Ai} \end{align} その平均点を \begin{align} {\bar{T}}_A=\frac{1}{96}\sum_{i=1}^{96}T_{Ai} \end{align} とすると、 平均点 ${\bar{T}}_A$ は、正規分布の標本平均の分布であるから、 \begin{align} {\bar{T}}_A \sim \mathrm{N} \left(\mu_A,\frac{{20}^2}{96}\right) \end{align} このとき、真の平均点の95%の信頼区間は、 \begin{gather} {\bar{T}}_A-z_{0.025} \cdot \frac{20}{\sqrt{96}} \le \mu_A \le {\bar{T}}_A+z_{0.025} \cdot \frac{20}{\sqrt{96}}\\ {\bar{T}}_A-1.96 \cdot \frac{20}{\sqrt{96}} \le \mu_A \le {\bar{T}}_A+1.96 \cdot \frac{20}{\sqrt{96}}\\ {\bar{T}}_A-4.001 \le \mu_A \le {\bar{T}}_A+4.001 \end{gather} 信頼区間の幅は、 \begin{align} L_A=2 \cdot 1.96 \cdot \frac{20}{\sqrt{96}}\cong8.00 \end{align} 同様に、$\mu_B$ の95%の信頼区間の幅は、 \begin{align} L_B=2 \cdot 1.96 \cdot \frac{20}{\sqrt{104}}\cong7.69 \end{align} よって、これらの比は、 \begin{align} \frac{L_A}{L_B}&=\frac{2 \cdot 1.96 \cdot 20}{2 \cdot 1.96 \cdot 20} \cdot \frac{\sqrt{104}}{\sqrt{96}}\\ &=\frac{2\sqrt2 \cdot \sqrt{13}}{2\sqrt2 \cdot \sqrt{12}}\\ &=\frac{\sqrt{13}}{\sqrt{12}} \end{align} $\blacksquare$
〔5〕信頼区間の幅にもとづくサンプルサイズの設計
〔4〕の結果より、グループAに振り分けられる学生の数は、 \begin{align} 96 \le X \end{align} 二項分布の正規近似により、漸近的に \begin{align} X \sim \mathrm{N} \left(\frac{n}{2},\frac{n}{4}\right) \end{align} このとき、 \begin{gather} P \left(96 \le X\right) \geq 0.8\\ P \left(\frac{96-\frac{n}{2}}{\frac{\sqrt n}{2}} \le \frac{X-\frac{n}{2}}{\frac{\sqrt n}{2}}\right) \geq 0.8\\ P \left(\frac{192-n}{\sqrt n} \le Z\right) \geq 0.8\\ P \left(z_{0.2} \le Z\right) \geq 0.8 \end{gather} 付表1より、標準正規分布の下側20%点は $z_{0.2}\cong-0.84$ なので、 \begin{gather} \frac{192-n}{\sqrt n} \le -0.84\\ 0 \le n-0.84\sqrt n-192 \end{gather} ここで、$n=x^2$ とおくと、 \begin{align} x^2-0.84x-192 \geq 0 \end{align} 2次方程式の解の公式 $x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$ より、 \begin{align} x&=\frac{0.84\pm\sqrt{{0.84}^2-4 \cdot 1 \cdot \left(-192\right)}}{2}\\ &=0.42\pm\sqrt{{0.42}^2+192} \end{align} $0 \le x$ より、 \begin{align} x=0.421+\sqrt{{0.421}^2+192}\cong14.283 \end{align} したがって、 \begin{align} n \le {14.283}^2\cong204.00 \end{align} よって、全体の人数は204人以下でなければならない。 $\blacksquare$
0 件のコメント:
コメントを投稿