本稿では、超幾何分布における任意の試行結果どうしの共分散を導出しています。導出自体は高校数学における順列の知識があれば十分ですが、統計学に深入りしていくとそうした基本的な考え方を忘れがちになるので、基本事項の復習としてもとてもいい問題です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【公式】超幾何分布の共分散
【公式】
超幾何分布の共分散
Covariance of Hypergeometric Distribution
確率変数 $X$ が超幾何分布
\begin{align}
X \sim \mathrm{HG} \left(N,k,n\right)
\end{align}
に従い、
1番目から $n$ 番目までの抽出結果を1列に並べていくとする。
$i$ 番目の抽出結果について、関心のある性質 $A$ を
持たないときは、$X_i=0$
持つときは、$X_i=1$
という値を取るものとし、
\begin{align}
X_i=1
\end{align}
のときを「成功」と呼ぶことにする。
(I)$i$ 番目の成功確率
$i$ 番目の抽出結果が成功となる確率は、
\begin{align}
P \left(X_i=1\right)=\frac{k}{N}
\end{align}
(II)$i,j$ 番目の同時成功確率
$i$ 番目と $j$ 番目($i \neq j$)の抽出結果が共に成功となる確率は、
\begin{align}
P \left(X_i=1,X_j=1\right)=\frac{k \left(k-1\right)}{N \left(N-1\right)}
\end{align}
(III)抽出結果の共分散
確率変数 $X_i,X_j$ の共分散は、
\begin{align}
\mathrm{Cov} \left(X_i,X_j\right)=-\frac{k \left(N-k\right)}{N^2 \left(N-1\right)}
\end{align}
で与えられる。
導出
ここでは、箱の中に黒いボールが $k$ 個、赤いボールが $N-k$ 個入っているとし、取り出したボールが「黒」ならば、「成功」、すなわち \begin{align} X_i=1 \end{align} とする。
(I)$i$ 番目の成功確率
抽出したボールを、取り出した順に1列に並べていくとき、$N$ 個の中から $n$ 個を選んで並べる場合の数は、
\begin{align}
{}_{N}P_n
\end{align}
通りある。
$i$ 番目を成功とするためには、
まず最初に、$i$ 番目に黒いボールを配置し、
それから残りの $n-1$ 個を自由に並べればよい。
このような並べ方は、
$i$ 番目の黒いボールの選び方が $k$ 通り
残りの $n-1$ 個の並べ方が ${}_{N-1}P_{n-1}$ 通り
なので、
全部で
\begin{align}
k \cdot {}_{N-1}P_{n-1}
\end{align}
通りある。
したがって、$i$ 番目の成功確率は、
\begin{align}
P \left(X_i=1\right)&=\frac{k \cdot {}_{N-1}P_{n-1}}{{}_{N}P_n}\\
&=k \cdot \frac{ \left(N-1\right)!}{ \left\{ \left(N-1\right)- \left(n-1\right)\right\}!} \cdot \frac{ \left(N-n\right)!}{N!}\\
&=k \cdot \frac{ \left(N-1\right)!}{ \left(N-n\right)!} \cdot \frac{ \left(N-n\right)!}{N!}\\
&=\frac{k}{N}
\end{align}
$\blacksquare$
(II)$i,j$ 番目の同時成功確率
$i$ 番目と $j$ 番目を成功とするためには、
まず最初に、$i$ 番目と $j$ 番目に黒いボールを配置し、
それから残りの $n-2$ 個を自由に並べればよい。
このような並べ方は、
$i$ 番目の黒いボールの選び方が $k$ 通り
$j$ 番目の黒いボールの選び方が $k-1$ 通り
残りの $n-2$ 個の並べ方が ${}_{N-2}P_{n-2}$ 通り
なので、
全部で
\begin{align}
k \left(k-1\right) \cdot {}_{N-2}P_{n-2}
\end{align}
通りある。
したがって、$i$ 番目と $j$ 番目の同時成功確率は、
\begin{align}
P \left(X_i=1,X_j=1\right)&=\frac{k \left(k-1\right) \cdot {}_{N-2}P_{n-2}}{{}_{N}P_n}\\
&=k \left(k-1\right) \cdot \frac{ \left(N-2\right)!}{ \left\{ \left(N-2\right)- \left(n-2\right)\right\}!} \cdot \frac{ \left(N-n\right)!}{N!}\\
&=k \cdot \frac{ \left(N-2\right)!}{ \left(N-n\right)!} \cdot \frac{ \left(N-n\right)!}{N!}\\
&=\frac{k \left(k-1\right)}{N \left(N-1\right)}
\end{align}
$\blacksquare$
(III)抽出結果の共分散
期待値の定義式 $E \left(X\right)=\sum_{-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、$i$ 番目の抽出結果の期待値は、
\begin{align}
E \left(X_i\right)&=1 \cdot P \left(X_i=1\right)+0 \cdot P \left(X_i=0\right)\\
&=\frac{k}{N}
\end{align}
期待値の定義式 $E \left(XY\right)=\sum_{y=-\infty}^{\infty}\sum_{x=-\infty}^{\infty}{xy \cdot f \left(x,y\right)}$ より、$i,j$ 番目の抽出結果の積の期待値は、
\begin{align}
E \left(X_iX_j\right)=&1 \cdot 1 \cdot P \left(X_i=1,X_j=1\right)+1 \cdot 0 \cdot P \left(X_i=1,X_j=0\right)\\
&+0 \cdot 1 \cdot P \left(X_i=0,X_j=1\right)+0 \cdot 0 \cdot P \left(X_i=0,X_j=0\right)\\
=&\frac{k \left(k-1\right)}{N \left(N-1\right)}
\end{align}
共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、
\begin{align}
\mathrm{Cov} \left(X,Y\right)&=\frac{k \left(k-1\right)}{N \left(N-1\right)}-\frac{k}{N} \cdot \frac{k}{N}\\
&=\frac{k}{N} \left(\frac{k-1}{N-1}-\frac{k}{N}\right)\\
&=\frac{k}{N} \cdot \frac{N \left(k-1\right)- \left(N-1\right)k}{N \left(N-1\right)}\\
&=\frac{k}{N} \cdot \frac{Nk-N-Nk+k}{N \left(N-1\right)}\\
&=-\frac{k \left(N-k\right)}{N^2 \left(N-1\right)}
\end{align}
$\blacksquare$
(IV)それぞれの試行結果の分散
期待値の定義式 $E \left(X^2\right)=\sum_{-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より
\begin{align}
E \left(X_i^2\right)&=1^2 \cdot P \left(X_i=1\right)+0^2 \cdot P \left(X_i=0\right)\\
&=\frac{k}{N}
\end{align}
分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、
\begin{align}
V \left(X_i\right)&=\frac{k}{N}-\frac{k^2}{N^2}\\
&=\frac{k}{N} \left(1-\frac{k}{N}\right)\\
&=\frac{k}{N} \cdot \frac{N-k}{N}
\end{align}
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.107-109
0 件のコメント:
コメントを投稿