本稿では、①定義に沿った方法、②独立でないベルヌーイ試行の和と考える方法の2通りの方法で、超幾何分布の期待値と分散を導出しています。①の方法は計算が煩雑で、②の方法は和の分散の一般公式を用いるため、いずれの方法もそれなりに大変ではありますが、基本事項としてしっかりと押さえておきたいところです。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【公式】超幾何分布の期待値・分散
【公式】
超幾何分布の期待値・分散
Expected Value and Variance of Hypergeometric Distribution
超幾何分布 $\mathrm{HG}(N,k,n)$ の期待値 $E(X)$ と分散 $V \left(X\right)$ は、 \begin{gather} E \left(X\right)=n \cdot \frac{k}{N}\\ V \left(X\right)=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-n}{N-1} \end{gather} で与えられる。
導出法①:定義に沿った方法
(i)期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、
\begin{align}
E \left(X\right)=\sum_{x=0}^{n}{x \cdot \frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}}
\end{align}
$x=0$ の項を外に出すと、
\begin{align}
E \left(X\right)&=0+\sum_{x=1}^{n}{x \cdot \frac{k!}{x! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n! \left(N-n\right)!}{N!}}\\
&=\sum_{x=1}^{n}{x \cdot \frac{k!}{x! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n! \left(N-n\right)!}{N!}}
\end{align}
この式を変形すると、
\begin{align}
E \left(X\right)&=\sum_{x=1}^{n}{\frac{k \left(k-1\right)!}{ \left(x-1\right)! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n \left(n-1\right)! \left(N-n\right)!}{N \left(N-1\right)!}}\\
&=n \cdot \frac{k}{N}\sum_{x=1}^{n}{\frac{ \left(k-1\right)!}{ \left(x-1\right)! \left\{ \left(k-1\right)- \left(x-1\right)\right\}!} \cdot \frac{ \left\{ \left(N-1\right)- \left(k-1\right)\right\}!}{ \left\{ \left(n-1\right)- \left(x-1\right)\right\}! \left[ \left\{ \left(N-1\right)- \left(k-1\right)\right\}- \left\{ \left(n-1\right)- \left(x-1\right)\right\}\right]!} \cdot \frac{ \left(n-1\right)! \left\{ \left(N-1\right)- \left(n-1\right)\right\}!}{ \left(N-1\right)!}}\tag{1}
\end{align}
ここで、以下のように変数変換すると、
\begin{gather}
y=x-1\\
M=N-1\\
m=n-1\\
l=k-1\\
\end{gather}
\begin{align}
x:1\rightarrow n \quad \Rightarrow \quad y:0\rightarrow m
\end{align}
となるので、
式 $(1)$ は、
\begin{align}
E \left(X\right)&=n \cdot \frac{k}{N}\sum_{y=0}^{m}{\frac{l!}{y! \left(l-y\right)!} \cdot \frac{ \left(M-l\right)!}{ \left(m-y\right)! \left\{ \left(M-l\right)- \left(m-y\right)\right\}!} \cdot \frac{m! \left(M-m\right)!}{M!}}\\
&=\frac{nk}{N}\sum_{y=0}^{m}\frac{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}{{}_{M}C_m}
\end{align}
ヴァンデルモンドの恒等式 $\sum_{y=0}^{m}{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}={}_{M}C_m$ より、
\begin{align}
E \left(X\right)&=n \cdot \frac{k}{N} \cdot \frac{{}_{M}C_m}{{}_{M}C_m}\\
&=n \cdot \frac{k}{N}
\end{align}
$\blacksquare$
(ii)分散
2次階乗モーメントの定義式 $E \left\{X \left(X-1\right)\right\}=\sum_{x=0}^{\infty}{x \left(x-1\right) \cdot f \left(x\right)}$ より、
\begin{align}
E \left\{X \left(X-1\right)\right\}&=\sum_{x=0}^{n}{x \left(x-1\right) \cdot \frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}}\\
&=\sum_{x=0}^{n}{x \left(x-1\right) \cdot \frac{k!}{x! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n! \left(N-n\right)!}{N!}}
\end{align}
$x=0,x=1$ の項を外に出すと、
\begin{align}
E \left\{X \left(X-1\right)\right\}&=0+0+\sum_{x=2}^{n}{\frac{k!}{ \left(x-2\right)! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n! \left(N-n\right)!}{N!}}\\
&=\sum_{x=2}^{n}{\frac{k!}{ \left(x-2\right)! \left(k-x\right)!} \cdot \frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!} \cdot \frac{n! \left(N-n\right)!}{N!}}
\end{align}
この式を変形すると、
\begin{align}
E \left\{X \left(X-1\right)\right\}&=\sum_{x=2}^{n}{\frac{k \left(k-1\right) \left(k-2\right)!}{ \left(x-2\right)! \left\{ \left(k-2\right)- \left(x-2\right)\right\}!} \cdot \frac{ \left\{ \left(N-2\right)- \left(k-2\right)\right\}!}{ \left\{ \left(n-2\right)- \left(x-2\right)\right\}! \left[ \left\{ \left(N-2\right)- \left(k-2\right)\right\}- \left\{ \left(n-2\right)- \left(x-2\right)\right\}\right]!} \cdot \frac{n \left(n-1\right) \left(n-2\right)! \left(N-n\right)!}{N \left(N-1\right) \left(N-2\right)!}}\\
&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)}\sum_{x=2}^{n}{\frac{ \left(k-2\right)!}{ \left(x-2\right)! \left\{ \left(k-2\right)- \left(x-2\right)\right\}!} \cdot \frac{ \left\{ \left(N-2\right)- \left(k-2\right)\right\}!}{ \left\{ \left(n-2\right)- \left(x-2\right)\right\}! \left[ \left\{ \left(N-2\right)- \left(k-2\right)\right\}- \left\{ \left(n-2\right)- \left(x-2\right)\right\}\right]!} \cdot \frac{ \left(n-2\right)! \left\{ \left(N-2\right)- \left(n-2\right)\right\}!}{ \left(N-2\right)!}}\tag{2}
\end{align}
ここで、以下のように変数変換すると、
\begin{gather}
y=x-2\\
M=N-2\\
m=n-2\\
l=k-2
\end{gather}
\begin{align}
x:2\rightarrow n \quad \Rightarrow \quad y:0\rightarrow m
\end{align}
となるので、
式 $(2)$ は、
\begin{align}
E \left\{X \left(X-1\right)\right\}&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)}\sum_{y=0}^{m}{\frac{l!}{y! \left(l-y\right)!} \cdot \frac{ \left(M-l\right)!}{ \left(m-y\right)! \left\{ \left(M-l\right)- \left(m-y\right)\right\}!} \cdot \frac{m! \left(M-m\right)!}{M!}}\\
&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)}\sum_{z=0}^{n}\frac{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}{{}_{M}C_m}
\end{align}
ヴァンデルモンドの恒等式 $\sum_{y=0}^{m}{{}_{l}C_y \cdot {}_{M-l}C_{m-y}}={}_{M}C_m$ より、
\begin{align}
E \left\{X \left(X-1\right)\right\}&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)} \cdot \frac{{}_{M}C_m}{{}_{M}C_m}\\
&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)}
\end{align}
階乗モーメントを用いた分散の公式 $V \left(X\right)=E \left\{X \left(X-1\right)\right\}+E \left(X\right)- \left\{E \left(X\right)\right\}^2$ より、
\begin{align}
V \left(X\right)&=\frac{k \left(k-1\right)n \left(n-1\right)}{N \left(N-1\right)}+\frac{nk}{N}-\frac{n^2k^2}{N^2}\\
&=n \cdot \frac{k}{N} \left\{\frac{ \left(k-1\right) \left(n-1\right)}{ \left(N-1\right)}+1-\frac{nk}{N}\right\}\\
&=n \cdot \frac{k}{N} \cdot \frac{N \left(k-1\right) \left(n-1\right)+N \left(N-1\right)-nk \left(N-1\right)}{N \left(N-1\right)}\\
&=n \cdot \frac{k}{N} \cdot \frac{nNk-Nk-nN+N+N^2-N-nNk+nk}{N \left(N-1\right)}\\
&=n \cdot \frac{k}{N} \cdot \frac{-Nk-nN+N^2+nk}{N \left(N-1\right)}\\
&=n \cdot \frac{k}{N} \cdot \frac{N \left(N-k\right)-n \left(N-k\right)}{N \left(N-1\right)}\\
&=n \cdot \frac{k}{N} \cdot \frac{ \left(N-k\right) \left(N-n\right)}{N \left(N-1\right)}\\
&=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-n}{N-1}
\end{align}
$\blacksquare$
導出法②:独立でないベルヌーイ試行の和と考える方法
超幾何分布の確率変数 $Y$ を互いに独立でないベルヌーイ分布に従う確率変数 $X_i\ \left(i=1,2, \cdots ,n\right)$ の和と考えると、
\begin{align}
Y=X_1+X_2+ \cdots +X_n
\end{align}
それぞれの試行結果の分散と共分散は、
\begin{gather}
E \left(X_i\right)=\frac{k}{N}\\
V \left(X_i\right)=\frac{k}{N} \cdot \frac{N-k}{N}\\
\mathrm{Cov} \left(X_i,X_j\right)=-\frac{k \left(N-k\right)}{N^2 \left(N-1\right)}\\
\end{gather}
(i)期待値
期待値の性質 $E \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}E \left(X_i\right)$ より、
\begin{align}
E \left(Y\right)=E \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}\frac{k}{N}=n \cdot \frac{k}{N}
\end{align}
(ii)分散
和の分散の一般公式より、
\begin{align}
V \left(Y\right)=\sum_{i=1}^{n}V \left(X_i\right)+\sum_{j \neq i}\sum_{i=1}^{n}{\mathrm{Cov} \left(X_i,X_j\right)}\\
\end{align}
ここで、共分散について、$i \neq j$ となる $ \left(i,j\right)$ の組み合わせは、
$i$ の選び方が $n$ 通り
$j$ の選び方が $n-1$ 通り
あるので、
全部で
\begin{align}
n \left(n-1\right)
\end{align}
通りある。
したがって、
\begin{align}
V \left(Y\right)&=n \cdot \frac{k}{N} \cdot \frac{N-k}{N}+n \left(n-1\right) \left(-\frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{1}{N-1}\right)\\
&=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \left(1-\frac{n-1}{N-1}\right)\\
&=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-1-n+1}{N-1}\\
&=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-n}{N-1}
\end{align}
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.108-109
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.84-86
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.50 演習問題3
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.90-91
0 件のコメント:
コメントを投稿