本稿には、2015年に実施された統計検定1級『医薬生物学』 問2の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕超幾何分布の確率関数と階乗モーメント
(1)本問の確率変数 $X$ は超幾何分布に従うと考えられるので、
\begin{gather}
x=\mathrm{max} \left\{0,n-w\right\}, \cdots ,\mathrm{min} \left\{n,r\right\}\\
f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{r}C_x \cdot {}_{w}C_{n-x}}{{}_{r+w}C_n}\\0\\\end{matrix}\right.
\end{gather}
(2A)確率関数であることの証明
(i)すべての $x$ に関して、$f \left(x\right) \geq 0$
二項係数の性質 $0 \le {}_{a}C_b$ より、
\begin{align}
f \left(x\right)=\frac{{}_{r}C_x \cdot {}_{w}C_{n-x}}{{}_{r+w}C_n} \geq 0
\end{align}
(ii)すべての確率の和が1
\begin{align}
\sum_{x=0}^{n}f \left(x\right)=\sum_{x=0}^{n}\frac{{}_{r}C_x \cdot {}_{w}C_{n-x}}{{}_{r+w}C_n}
\end{align}
ヴァンデルモンドの恒等式 $\sum_{x=0}^{n}{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}={}_{N}C_n$ より、
\begin{align}
\sum_{x=0}^{n}f \left(x\right)=\frac{{}_{r+w}C_n}{{}_{r+w}C_n}=1
\end{align}
よって、確率関数の定義を満たしているため、確率関数である。
(2B)$k$ 次階乗モーメント
$k$ 次階乗モーメントの定義式 $E \left[X^{ \left(k\right)}\right]=\sum_{x=0}^{\infty}{x^{ \left(k\right)} \cdot f \left(x\right)}$ より、
\begin{align}
E \left[X^{ \left(k\right)}\right]&=\sum_{x=0}^{n}{x \left(x-1\right) \cdots \left(x-k+1\right) \cdot \frac{{}_{r}C_x \cdot {}_{w}C_{n-x}}{{}_{r+w}C_n}}\\
&=\sum_{x=0}^{n}{x^{ \left(k\right)} \cdot \frac{r!}{x! \left(r-x\right)!} \cdot \frac{w!}{ \left(n-x\right)! \left(w-n+x\right)!} \cdot \frac{n! \left(r+w-n\right)!}{ \left(r+w\right)!}}\\
&=0+ \cdots +0+\sum_{x=k-1}^{n}{x^{ \left(k\right)} \cdot \frac{r!}{x! \left(r-x\right)!} \cdot \frac{w!}{ \left(n-x\right)! \left(w-n+x\right)!} \cdot \frac{n! \left(r+w-n\right)!}{ \left(r+w\right)!}}\\
&=\sum_{x=k-1}^{n}{\frac{r!}{ \left(x-k\right)! \left(r-x\right)!} \cdot \frac{w!}{ \left(n-x\right)! \left(w-n+x\right)!} \cdot \frac{n! \left(r+w-n\right)!}{ \left(r+w\right)!}}\\
&=\frac{n^{ \left(k\right)} \cdot r^{ \left(k\right)}}{ \left(r+w\right)^{ \left(k\right)}}\sum_{x=k-1}^{n}{\frac{ \left(r-k\right)!}{ \left(x-k\right)! \left(r-x\right)!} \cdot \frac{w!}{ \left(n-x\right)! \left(w-n+x\right)!} \cdot \frac{ \left(n-k\right)! \left(r+w-n\right)!}{ \left(r+w-k\right)!}}\\
&=\frac{n^{ \left(k\right)} \cdot r^{ \left(k\right)}}{ \left(r+w\right)^{ \left(k\right)}}\sum_{x=k-1}^{n}\frac{{}_{r-k}C_{x-k} \cdot {}_{w}C_{n-x}}{{}_{r+w-k}C_{n-k}}
\end{align}
ここで、以下のように変数変換すると、
\begin{gather}
y=x-k\\
M=r+w-k\\
m=n-k\\
l=r-k
\end{gather}
\begin{align}
E \left[X^{ \left(k\right)}\right]&=\frac{n^{ \left(k\right)} \cdot r^{ \left(k\right)}}{ \left(r+w\right)^{ \left(k\right)}} \cdot \sum_{y=0}^{n}\frac{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}{{}_{M}C_m}
\end{align}
ヴァンデルモンドの恒等式 $\sum_{y=0}^{m}{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}={}_{M}C_m$ より、
\begin{align}
E \left[X^{ \left(k\right)}\right]&=\frac{n^{ \left(k\right)} \cdot r^{ \left(k\right)}}{ \left(r+w\right)^{ \left(k\right)}} \cdot \frac{{}_{M}C_m}{{}_{M}C_m}\\
&=\frac{n^{ \left(k\right)} \cdot r^{ \left(k\right)}}{ \left(r+w\right)^{ \left(k\right)}}
\end{align}
$\blacksquare$
〔2〕フィッシャーの直接確率計算法
(1)$2\times2$分割表の左上セルの観測度数が従う分布
周辺度数が固定されているとの仮定のもとで、$n_{11}$ は超幾何分布に従うことが知られており、本問の場合、
\begin{gather}
n_{11}=\mathrm{max} \left\{0,n_{1+}-n_{+2}\right\}, \cdots ,\mathrm{min} \left\{n_{1+},n_{+1}\right\}\\
f \left(n_{11}\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{n_{+1}}C_{n_{11}} \cdot {}_{n_{+2}}C_{n_{12}}}{{}_{n_{++}}C_{n_{1+}}}\\0\\\end{matrix}\right.
\end{gather}
$\blacksquare$
(2)左上セルの観測度数とその実現確率
(1)の結果より、表のデータを代入すると、
\begin{align}
5-3 \le n_{11} \le 5\Rightarrow2 \le n_{11} \le 5
\end{align}
それぞれの実現値の表は以下のようになる。
再発あり | 再発なし | 合計 | |
---|---|---|---|
男性 | $2$ | $3$ | $5$ |
女性 | $4$ | $0$ | $4$ |
合計 | $6$ | $3$ | $9$ |
再発あり | 再発なし | 合計 | |
---|---|---|---|
男性 | $3$ | $2$ | $5$ |
女性 | $3$ | $0$ | $4$ |
合計 | $6$ | $3$ | $9$ |
再発あり | 再発なし | 合計 | |
---|---|---|---|
男性 | $4$ | $1$ | $5$ |
女性 | $2$ | $0$ | $4$ |
合計 | $6$ | $3$ | $9$ |
再発あり | 再発なし | 合計 | |
---|---|---|---|
男性 | $5$ | $0$ | $5$ |
女性 | $1$ | $0$ | $4$ |
合計 | $6$ | $3$ | $9$ |
また、それぞれの確率を求めると、 \begin{align} P \left(n_{11}=2\right)&=\frac{{}_{6}C_2 \cdot {}_{3}C_3}{{}_{9}C_5}\\ &=\frac{6 \cdot 5}{2 \cdot 1} \cdot \frac{3!}{3!} \cdot \frac{5 \cdot 4 \cdot 3 \cdot 2 \cdot 1}{9 \cdot 8 \cdot 7 \cdot 6 \cdot 5}\\ &=\frac{5}{42}\\ &\cong0.1190 \end{align} \begin{align} P \left(n_{11}=3\right)&=\frac{{}_{6}C_3 \cdot {}_{3}C_2}{{}_{9}C_5}\\ &=\frac{6 \cdot 5 \cdot 4}{3 \cdot 2 \cdot 1} \cdot \frac{3 \cdot 2}{2 \cdot 1} \cdot \frac{5 \cdot 4 \cdot 3 \cdot 2 \cdot 1}{9 \cdot 8 \cdot 7 \cdot 6 \cdot 5}\\ &=\frac{10}{21}\\ &\cong0.4762 \end{align} \begin{align} P \left(n_{11}=4\right)&=\frac{{}_{6}C_4 \cdot {}_{3}C_1}{{}_{9}C_5}\\ &=\frac{6 \cdot 5 \cdot 4 \cdot 3}{4 \cdot 3 \cdot 2 \cdot 1} \cdot 3 \cdot \frac{5 \cdot 4 \cdot 3 \cdot 2 \cdot 1}{9 \cdot 8 \cdot 7 \cdot 6 \cdot 5}\\ &=\frac{5}{14}\\ &\cong0.3571 \end{align} \begin{align} P \left(n_{11}=5\right)&=\frac{{}_{6}C_5 \cdot {}_{3}C_0}{{}_{9}C_5}\\ &=\frac{6 \cdot 5 \cdot 4 \cdot 3 \cdot 2}{5 \cdot 4 \cdot 3 \cdot 2 \cdot 1} \cdot 1 \cdot \frac{5 \cdot 4 \cdot 3 \cdot 2 \cdot 1}{9 \cdot 8 \cdot 7 \cdot 6 \cdot 5}\\ &=\frac{1}{21}\\ &\cong0.0476 \end{align} $\blacksquare$
(3)フィッシャーの直接確率計算法による有意確率の算出
「男性の急性心筋梗塞再発率は女性に比較して低い」を対立仮説として片側検定する場合、有意確率は、
\begin{align}
P \left(n_{11} \le 2\right)=P \left(n_{11}=2\right)=0.1190
\end{align}
「男性における急性心筋梗塞再発率は女性と異なる」とする両側仮説において、有意確率は、両側の極端な値を取る確率として、
\begin{align}
P \left(n_{11} \le 2,5 \le n_{11}\right)=P \left(n_{11}=2\right)+P \left(n_{11}=5\right)\cong0.1667
\end{align}
なお、各行または各列の周辺の和度数が等しければ超幾何分布は対称であるため、両側検定のP値は片側検定のP値の2倍として与えられる。上記の例ではこれは成り立たないことから、両側P値を上述のように計算することが多いが、片側P値を2倍するとする考え方もある。
$\blacksquare$
0 件のコメント:
コメントを投稿