超幾何分布の定義と概要-あるノマドの知の旅路～数学・統計学への道

超幾何分布の定義と概要

公開日：更新日：

本稿では、超幾何分布の定義と概要についてまとめています。確率関数であることの証明、確率関数の導出、期待値・分散、共分散、最頻値の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

超幾何分布

定義・意味

総数 $N$ 個の中に、性質 $A$ を持つ個体が $k$ 個
性質 $A$ を持たない個体が $N-k$ 個あるとき、 $N$ 個のうち $n$ 個を非復元抽出で抽出したときに性質 $A$ を持つ個体の数 $X$ が従う離散型確率分布を超幾何分布 hypergeometric distribution と呼ぶ。

確率関数

確率関数 $f(x)$ は、 \begin{align} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}&x=\mathrm{max} \left\{0,n+k-N\right\}, \cdots ,\mathrm{min} \left\{n,k\right\}\\0&\mathrm{other}\\\end{matrix}\right. \end{align} で与えられる。

略記法

また、超幾何分布は、 \begin{align} \mathrm{HG} \left(N,k,n\right) \end{align} と略記されることがある。

確率変数の取り得る値の範囲

$X$ の取る範囲について \begin{align} \mathrm{max} \left\{0,n+k-N\right\} \le x \le \mathrm{min} \left\{n,k\right\} \end{align} の場合は、複雑であるため、以後、このブログでは、 \begin{align} 0 \le x \le n \end{align} の場合を考えます。

確率関数であることの証明

証明

（i）すべての $x$ に関して、$f \left(x\right) \geq 0$
二項係数の性質 $0 \le {}_{a}C_b$ より、 \begin{align} f \left(x\right)=\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \geq 0 \end{align} （ii）すべての確率の和が1 \begin{align} \sum_{x=0}^{n}f \left(x\right)=\sum_{x=0}^{n}\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \end{align} ヴァンデルモンドの恒等式 $\sum_{x=0}^{n}{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}={}_{N}C_n$ より、 \begin{align} \sum_{x=0}^{n}f \left(x\right)=\frac{{}_{N}C_n}{{}_{N}C_n}=1 \end{align} よって、確率関数の定義を満たしているため、確率関数である。 $\blacksquare$

確率関数の導出

導出

$N$ 個の中から、$n$ 個を抽出する選び方は、 \begin{align} {}_{N}C_n \end{align} 通りある。性質 $A$ を持つ個体が $x$ 個となる選び方は、まず、性質 $A$ を持つ $k$ 個の中から、$x$ 個を抽出し、
性質 $A$ を持たない $N-k$ 個の中から、残りの $n-x$ 個を抽出すればよいので、そのような選び方は、 \begin{align} {}_{k}C_x\times{}_{N-k}C_{n-x} \end{align} 通りある。したがって、このような事象が起こる確率は（数学的確率によって）、 \begin{align} P \left(X=x\right)=\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \end{align} $\blacksquare$

重要事項のまとめ

略記法

\begin{align} \mathrm{HG} \left(N,k,n\right) \end{align}

パラメータ

\begin{gather} N= \left\{0,1,2, \cdots \right\}\\ k= \left\{0,1,2, \cdots ,N\right\}\\ n= \left\{0,1,2, \cdots ,N\right\} \end{gather}

確率関数

\begin{align} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}&x=0,1,2, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{align} 最も一般的には、 \begin{align} x= \left\{\mathrm{max} \left\{0,n+k-N\right\} \le x \le \mathrm{min} \left\{n,k\right\}\right\} \end{align}

期待値

\begin{align} E \left(X\right)=n \cdot \frac{k}{N} \end{align}

分散

\begin{align} V \left(X\right)=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-n}{N-1} \end{align}

最頻値

\begin{align} Mo \left(X\right)= \left\{\begin{matrix}\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1,\frac{ \left(n+1\right) \left(k+1\right)}{N+2}&\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\in\boldsymbol{N}\\ \left\lceil\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\right\rceil&e\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\notin\boldsymbol{N}\\\end{matrix}\right. \end{align} $x\in\boldsymbol{N}$ は整数であることを表す。 $ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。

共分散

\begin{align} \mathrm{Cov} \left(X_i,X_j\right)=-\frac{k \left(N-k\right)}{N^2 \left(N-1\right)} \end{align}

参考文献

小寺平治著. 数理統計：明解演習. 共立出版, 1986, p.56
野田一雄, 宮岡悦良著. 入門・演習数理統計. 共立出版, 1990, p.107-110
竹村彰通著. 現代数理統計学. 創文社, 1991, p.84-86
久保川達也著, 新井仁之, 小林俊行, 斎藤毅, 吉田朋広編. 現代数理統計学の基礎. 共立出版, 2017, p.38-39
黒木学著. 数理統計学：統計的推論の基礎. 共立出版, 2020, p.88-93

超幾何分布の定義と概要

超幾何分布

定義・意味

確率関数

略記法

確率変数の取り得る値の範囲

確率関数であることの証明

確率関数の導出

重要事項のまとめ

略記法

パラメータ

確率関数

期待値

分散

最頻値

共分散

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

超幾何分布の定義と概要

超幾何分布

定義・意味

確率関数

略記法

確率変数の取り得る値の範囲

確率関数であることの証明

確率関数の導出

重要事項のまとめ

略記法

パラメータ

確率関数

期待値

分散

最頻値

共分散

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ブログアーカイブ