超幾何分布の定義と概要

公開日: 更新日:

【2023年3月4週】 【B000】数理統計学 【B030】離散型の確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、超幾何分布の定義と概要についてまとめています。確率関数であることの証明、確率関数の導出、期待値・分散、共分散、最頻値の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

超幾何分布

定義・意味

総数 $N$ 個の中に、 性質 $A$ を持つ個体が $k$ 個
性質 $A$ を持たない個体が $N-k$ 個
あるとき、 $N$ 個のうち $n$ 個を非復元抽出で抽出したときに 性質 $A$ を持つ個体の数 $X$ が従う離散型確率分布を超幾何分布 hypergeometric distribution と呼ぶ。

確率関数

確率関数 $f(x)$ は、 \begin{align} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}&x=\mathrm{max} \left\{0,n+k-N\right\}, \cdots ,\mathrm{min} \left\{n,k\right\}\\0&\mathrm{other}\\\end{matrix}\right. \end{align} で与えられる。

略記法

また、超幾何分布は、 \begin{align} \mathrm{HG} \left(N,k,n\right) \end{align} と略記されることがある。

確率変数の取り得る値の範囲

$X$ の取る範囲について \begin{align} \mathrm{max} \left\{0,n+k-N\right\} \le x \le \mathrm{min} \left\{n,k\right\} \end{align} の場合は、複雑であるため、 以後、このブログでは、 \begin{align} 0 \le x \le n \end{align} の場合を考えます。

確率関数であることの証明

証明

(i)すべての $x$ に関して、$f \left(x\right) \geq 0$
二項係数の性質 $0 \le {}_{a}C_b$ より、 \begin{align} f \left(x\right)=\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \geq 0 \end{align} (ii)すべての確率の和が1 \begin{align} \sum_{x=0}^{n}f \left(x\right)=\sum_{x=0}^{n}\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \end{align} ヴァンデルモンドの恒等式 $\sum_{x=0}^{n}{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}={}_{N}C_n$ より、 \begin{align} \sum_{x=0}^{n}f \left(x\right)=\frac{{}_{N}C_n}{{}_{N}C_n}=1 \end{align} よって、確率関数の定義を満たしているため、確率関数である。 $\blacksquare$

確率関数の導出

導出

$N$ 個の中から、$n$ 個を抽出する選び方は、 \begin{align} {}_{N}C_n \end{align} 通りある。 性質 $A$ を持つ個体が $x$ 個となる選び方は、 まず、性質 $A$ を持つ $k$ 個の中から、$x$ 個を抽出し、
性質 $A$ を持たない $N-k$ 個の中から、残りの $n-x$ 個を抽出
すればよいので、 そのような選び方は、 \begin{align} {}_{k}C_x\times{}_{N-k}C_{n-x} \end{align} 通りある。 したがって、このような事象が起こる確率は(数学的確率によって)、 \begin{align} P \left(X=x\right)=\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n} \end{align} $\blacksquare$

重要事項のまとめ

略記法

\begin{align} \mathrm{HG} \left(N,k,n\right) \end{align}

パラメータ

\begin{gather} N= \left\{0,1,2, \cdots \right\}\\ k= \left\{0,1,2, \cdots ,N\right\}\\ n= \left\{0,1,2, \cdots ,N\right\} \end{gather}

確率関数

\begin{align} f \left(x\right)= \left\{\begin{matrix}\displaystyle\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}&x=0,1,2, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{align} 最も一般的には、 \begin{align} x= \left\{\mathrm{max} \left\{0,n+k-N\right\} \le x \le \mathrm{min} \left\{n,k\right\}\right\} \end{align}

期待値

\begin{align} E \left(X\right)=n \cdot \frac{k}{N} \end{align}

分散

\begin{align} V \left(X\right)=n \cdot \frac{k}{N} \cdot \frac{N-k}{N} \cdot \frac{N-n}{N-1} \end{align}

最頻値

\begin{align} Mo \left(X\right)= \left\{\begin{matrix}\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1,\frac{ \left(n+1\right) \left(k+1\right)}{N+2}&\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\in\boldsymbol{N}\\ \left\lceil\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\right\rceil&e\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\notin\boldsymbol{N}\\\end{matrix}\right. \end{align} $x\in\boldsymbol{N}$ は整数であることを表す。 $ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。

共分散

\begin{align} \mathrm{Cov} \left(X_i,X_j\right)=-\frac{k \left(N-k\right)}{N^2 \left(N-1\right)} \end{align}

参考文献

  • 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.56
  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.107-110
  • 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.84-86
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.38-39
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.88-93

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ