統計検定 1級 2018年 統計数理 問2 超幾何分布と捕獲再捕獲法

公開日: 更新日:

【2023年6月2週】 【B000】数理統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2018年に実施された統計検定1級『統計数理』 問2の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕超幾何分布の成功確率と同時成功確率

(I)$i$ 番目の成功確率
抽出した球を、取り出した順に1列に並べていくとき、$N$ 個の中から $n$ 個を選んで並べる場合の数は、 \begin{align} {}_{N}P_n \end{align} 通りある。 $i$ 番目を成功とするためには、 まず最初に、$i$ 番目に赤球を配置し、
それから残りの $n-1$ 個を自由に並べればよい。
このような並べ方は、 $i$ 番目の赤球の選び方が $M$ 通り
残りの $n-1$ 個の並べ方が ${}_{N-1}P_{n-1}$ 通り
なので、 全部で \begin{align} M \cdot {}_{N-1}P_{n-1} \end{align} 通りある。 したがって、$i$ 番目の成功確率は、 \begin{align} P \left(X_i=1\right)&=\frac{M \cdot {}_{N-1}P_{n-1}}{{}_{N}P_n}\\ &=M \cdot \frac{ \left(N-1\right)!}{ \left\{ \left(N-1\right)- \left(n-1\right)\right\}!} \cdot \frac{ \left(N-n\right)!}{N!}\\ &=M \cdot \frac{ \left(N-1\right)!}{ \left(N-n\right)!} \cdot \frac{ \left(N-n\right)!}{N!}\\ &=\frac{M}{N} \end{align} $\blacksquare$

(II)$i,j$ 番目の同時成功確率
$i$ 番目と $j$ 番目を成功とするためには、 まず最初に、$i$ 番目と $j$ 番目に赤球を配置し、
それから残りの $n-2$ 個を自由に並べればよい。
このような並べ方は、 $i$ 番目の赤球の選び方が $M$ 通り
$j$ 番目の赤球の選び方が $M-1$ 通り
残りの $n-2$ 個の並べ方が ${}_{N-2}P_{n-2}$ 通り
なので、 全部で \begin{align} M \left(M-1\right) \cdot {}_{N-2}P_{n-2} \end{align} 通りある。 したがって、$i$ 番目と $j$ 番目の同時成功確率は、 \begin{align} P \left(X_i=1,X_j=1\right)&=\frac{M \left(M-1\right) \cdot {}_{N-2}P_{n-2}}{{}_{N}P_n}\\ &=M \left(M-1\right) \cdot \frac{ \left(N-2\right)!}{ \left\{ \left(N-2\right)- \left(n-2\right)\right\}!} \cdot \frac{ \left(N-n\right)!}{N!}\\ &=M \left(M-1\right) \cdot \frac{ \left(N-2\right)!}{ \left(N-n\right)!} \cdot \frac{ \left(N-n\right)!}{N!}\\ &=\frac{M \left(M-1\right)}{N \left(N-1\right)} \end{align} $\blacksquare$

〔2〕各試行の期待値・分散・共分散

(i)抽出結果の期待値
期待値の定義式 $E \left(X\right)=\sum_{-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、$i$ 番目の抽出結果の期待値は、 \begin{align} E \left(X_i\right)&=1 \cdot P \left(X_i=1\right)+0 \cdot P \left(X_i=0\right)\\ &=\frac{M}{N} \end{align}

(ii)抽出結果の共分散
期待値の定義式 $E \left(XY\right)=\sum_{y=-\infty}^{\infty}\sum_{x=-\infty}^{\infty}{xy \cdot f \left(x,y\right)}$ より、$i,j$ 番目の抽出結果の積の期待値は、 \begin{align} E \left(X_iX_j\right)=&1 \cdot 1 \cdot P \left(X_i=1,X_j=1\right)+1 \cdot 0 \cdot P \left(X_i=1,X_j=0\right)\\ &+0 \cdot 1 \cdot P \left(X_i=0,X_j=1\right)+0 \cdot 0 \cdot P \left(X_i=0,X_j=0\right)\\ =&\frac{M \left(M-1\right)}{N \left(N-1\right)} \end{align} 共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、 \begin{align} \mathrm{Cov} \left(X,Y\right)&=\frac{M \left(M-1\right)}{N \left(N-1\right)}-\frac{M}{N} \cdot \frac{M}{N}\\ &=\frac{M}{N} \left(\frac{M-1}{N-1}-\frac{M}{N}\right)\\ &=\frac{M}{N} \cdot \frac{N \left(M-1\right)- \left(N-1\right)M}{N \left(N-1\right)}\\ &=\frac{M}{N} \cdot \frac{NM-N-NM+k}{N \left(N-1\right)}\\ &=-\frac{M \left(N-M\right)}{N^2 \left(N-1\right)} \end{align} $\blacksquare$

(iii)抽出結果の分散
期待値の定義式 $E \left(X^2\right)=\sum_{-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より \begin{align} E \left(X_i^2\right)&=1^2 \cdot P \left(X_i=1\right)+0^2 \cdot P \left(X_i=0\right)\\ &=\frac{M}{N} \end{align} 分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、 \begin{align} V \left(X_i\right)&=\frac{M}{N}-\frac{M^2}{N^2}\\ &=\frac{M}{N} \left(1-\frac{M}{N}\right)\\ &=\frac{M}{N} \cdot \frac{N-M}{N} \end{align} $\blacksquare$

〔3〕超幾何分布の確率関数の導出

$N$ 個の中から、$n$ 個を抽出する選び方は、 \begin{align} {}_{N}C_n \end{align} 通りある。 このうち、赤球が $x$ 個となる選び方は、 まず、赤球 $M$ 個の中から、$x$ 個を抽出し、
青球 $N-M$ 個の中から、残りの $n-x$ 個を抽出
すればよいので、 そのような選び方は、 \begin{align} {}_{M}C_n\times{}_{N-M}C_{n-x} \end{align} 通りある。 したがって、このような事象が起こる確率は(数学的確率によって)、 \begin{align} P \left(X=x\right)=\frac{{}_{M}C_n\times{}_{N-M}C_{n-x}}{{}_{N}C_n} \end{align} $\blacksquare$

〔4〕超幾何分布の期待値と分散

(i)期待値
期待値の性質 $E \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}E \left(X_i\right)$ より、 \begin{align} E \left(X\right)=E \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}\frac{M}{N}=n \cdot \frac{M}{N} \end{align} (ii)分散
和の分散の一般公式より、 \begin{align} V \left(X\right)=\sum_{i=1}^{n}V \left(X_i\right)+\sum_{j \neq i}\sum_{i=1}^{n}\mathrm{Cov} \left(X_i,X_j\right)\\ \end{align} ここで、共分散について、$i \neq j$ となる $ \left(i,j\right)$ の組み合わせは、 $i$ の選び方が $n$ 通り
$j$ の選び方が $n-1$ 通り
あるので、 全部で \begin{align} n \left(n-1\right) \end{align} 通りある。 したがって、 \begin{align} V \left(X\right)&=n \cdot \frac{M}{N} \cdot \frac{N-M}{N}+n \left(n-1\right) \left(-\frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{1}{N-1}\right)\\ &=n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \left(1-\frac{n-1}{N-1}\right)\\ &=n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-1-n+1}{N-1}\\ &=n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-n}{N-1} \end{align} $\blacksquare$

〔5〕赤球の個数の推定量

〔4〕の結果より、 \begin{align} N\rightarrow N+K \quad M=K \end{align} と置き換えると、 \begin{align} E \left(X\right)=\frac{nK}{N+K} \end{align} これを $N$ について解くと、 \begin{gather} N+K=\frac{nK}{E \left(X\right)}\\ N=\frac{nK}{E \left(X\right)}-K\\ N=K \left\{\frac{n}{E \left(X\right)}-1\right\}\tag{1} \end{gather} いっぽう、 \begin{align} V \left(X\right)=\frac{N+K-n}{N+K-1} \cdot \frac{K}{N+K} \cdot \left(1-\frac{K}{N+K}\right) \cdot n \end{align} ここで、$N\rightarrow\infty$ のときの極限を取ると、 \begin{align} \lim_{N\rightarrow\infty}{V \left(X\right)}=1 \cdot 0 \cdot \left(1-0\right) \cdot n=0 \end{align} したがって、チェビシェフの不等式より、 \begin{align} \lim_{N\rightarrow\infty}{P \left( \left|X-E \left(X\right)\right| \geq \varepsilon\right)} \le \lim_{N\rightarrow\infty}{\frac{V \left(X\right)}{\varepsilon^2}}=0 \end{align} すなわち、$X$ は母平均 $E \left(X\right)$ の一致推定量となり、 \begin{align} X\cong E \left(X\right) \end{align} よって、式 $(1)$ より、 \begin{align} \hat{N}=K \left(\frac{n}{X}-1\right)\\ \end{align} 両辺の分散を取ると、 \begin{align} V \left(\hat{N}\right)&=V \left\{K \left(\frac{n}{X}-1\right)\right\}\\ &=n^2K^2V \left(\frac{1}{X}\right)\tag{2} \end{align} ここで、$g \left(x\right)=\frac{1}{x}$ を期待値まわりで2次の項までテイラー展開すると、 \begin{gather} g \left(x\right)\cong g \left\{E \left(X\right)\right\}+g^\prime \left\{E \left(X\right)\right\} \left\{x-E \left(X\right)\right\}+g^{\prime\prime} \left\{E \left(X\right)\right\} \left\{x-E \left(X\right)\right\}^2\\ \frac{1}{x}\cong\frac{1}{E \left(X\right)}-\frac{1}{ \left\{E \left(X\right)\right\}^2} \left\{x-E \left(X\right)\right\} \end{gather} 両辺の分散を取ると、 \begin{align} V \left(\frac{1}{X}\right)&\cong V \left[\frac{1}{E \left(X\right)}-\frac{1}{ \left\{E \left(X\right)\right\}^2} \left\{x-E \left(X\right)\right\}\right]\\ &\cong V \left[-\frac{X}{ \left\{E \left(X\right)\right\}^2}\right]\\ &\cong\frac{1}{ \left\{E \left(X\right)\right\}^4}V \left[X\right] \end{align} 期待値と分散 $E \left(X\right),V \left(X\right)$ を代入すると、 \begin{align} V \left(\frac{1}{X}\right)\cong \left(\frac{N+K}{nK}\right)^4 \cdot \frac{N+K-n}{N+K-1} \cdot \frac{K}{N+K} \cdot \frac{N}{N+K} \cdot n \cdot \end{align} したがって、式 $(2)$ より、 \begin{align} V \left(\hat{N}\right)&\cong n^2K^2 \cdot \left(\frac{N+K}{nK}\right)^4 \cdot \frac{N+K-n}{N+K-1} \cdot \frac{nK}{N+K} \cdot \frac{N}{N+K}\\ &\cong\frac{N \left(N+K\right)^2}{nK} \cdot \frac{N+K-n}{N+K-1}\\ &\cong\frac{N+K}{N+K-1} \cdot \frac{ \left(N+K\right) \left(N+K-n\right)N}{nK} \end{align} $N\rightarrow\infty$ のとき、$N+K\cong N+K-1$ となるので、 \begin{align} V \left(\hat{N}\right)\cong\frac{ \left(N+K\right) \left(N+K-n\right)N}{nK} \end{align} よって、 \begin{align} \varepsilon=\frac{\sqrt{ \left(N+K\right) \left(N+K-n\right)}}{\sqrt{nNK}} \end{align} $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ