二項分布の定義と概要

公開日: 更新日:

【2023年3月3週】 【B000】数理統計学 【B030】離散型の確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、二項分布の定義と概要についてまとめています。確率関数であることの証明、確率関数の導出、二項分布の正規近似(ド・モアブル=ラプラスの定理)、確率関数、累積分布関数、期待値・分散、確率母関数、モーメント母関数、最頻値、再生性の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

二項分布

定義・意味

成功確率が $p$ のベルヌーイ試行を独立に $n$ 回行ったときの成功回数 \begin{gather} X \end{gather} が従う離散型確率分布を二項分布 binomial distribution と呼ぶ。

確率関数

確率関数 $f(x)$ は、 \begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather} で与えられる。

略記法

また、二項分布は、 \begin{align} \mathrm{B} \left(n,p\right) \end{align} と略記されることがある。

確率関数であることの証明

証明

(i)すべての $x$ に関して、$P \left(x\right) \geq 0$
確率の基本性質 $0 \le p \le 1$ より、$0 \le 1-p$ なので、 \begin{align} f \left(x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \geq 0 \end{align} (ii)すべての確率の和が1
二項定理 $ \left(a+b\right)^n=\sum_{x=0}^{n}{{}_{n}C_xa^xb^{n-x}}$ において、$a=p,b=1-p$ とすると、 \begin{align} \sum_{x=0}^{n}f \left(x\right)= \left\{p+ \left(1-p\right)\right\}^n=1 \end{align} よって、確率関数の定義を満たしているため、確率関数である。 $\blacksquare$

確率関数の導出

導出

(i)すべての $x$ に関して、$P \left(x\right) \geq 0$
$i$ 回目の試行で成功する事象を \begin{align} A_i \end{align} 失敗する事象を \begin{align} A_i^C \end{align} とすると、 例えば、最初の $x$ 回が連続して成功し、残りの $n-x$ 回が連続して失敗する確率は、事象の独立性の定義から、 \begin{align} P \left(A_1 \cap \cdots \cap A_x \cap A_{x+1}^C \cap \cdots \cap A_n^C\right)&=P \left(A_1\right) \cdots P \left(A_x\right) \cdot P \left(A_{x+1}^C\right) \cdots P \left(A_n^C\right)\\ &=p \cdots p \cdot \left(1-p\right) \cdots \left(1-p\right)\\ &=p^x \left(1-p\right)^{n-x} \end{align} $n$ 回のベルヌーイ試行のうち、$x$ 回が成功、$n-x$ 回が失敗となる組み合わせは、$1 \sim n$ の $n$ 個の数字の中から「成功」とする数字を $x$ 個選ぶ組み合わせの数と考えられるので、${}_{n}C_x$ 通りある。

したがって、求める確率は、 \begin{align} f \left(x\right)=P \left(X=x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \end{align} $\blacksquare$

【定理】二項分布の正規近似:ド・モアブル=ラプラスの定理

【定理】
二項分布の正規近似:ド・モアブル=ラプラスの定理
Normal Approximation to the Binomial Distribution: De Moivre–Laplace Theorem

確率変数 $X$ が二項分布 \begin{gather} X \sim B \left(n,p\right) \end{gather} に従うとき、 $X$ を標準化した値 \begin{gather} Z=\frac{X-np}{\sqrt{np \left(1-p\right)}} \end{gather} について、 標準正規分布の累積分布関数を $\Phi \left(z\right)$ とすると、 \begin{gather} \lim_{n\rightarrow\infty}{P \left[\frac{X-np}{\sqrt{np \left(1-p\right)}} \le z\right]}=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}dz}=\Phi \left(z\right) \end{gather} が成り立つ。

連続修正

離散型確率変数の分布を連続型の分布で近似することから起こる誤差を改良するものとして、連続修正 continuity correction が使われることがある。

これは、$P \left(a \le X \le b\right)$ を \begin{gather} P \left(a-0.5 \le X \le b+0.5\right) \end{gather} としてから正規分布の近似を用いるものである。

つまり、 \begin{gather} P \left(a \le X \le b\right)\cong\Phi \left[\frac{b+0.5-np}{\sqrt{np \left(1-p\right)}}\right]-\Phi \left[\frac{a-0.5-np}{\sqrt{np \left(1-p\right)}}\right] \end{gather} で求める。

重要事項のまとめ

略記法

\begin{align} \mathrm{B} \left(n,p\right) \end{align}

パラメータ

\begin{gather} n= \left\{0,1, \cdots \right\}\\ 0 \le p \le 1 \end{gather}

確率関数

\begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather}

累積分布関数

\begin{gather} F \left(x\right)=\int_{F}^{\infty}{f_{m1,m2} \left(x\right)dx}\\ m_1=2 \left(x+1\right),m_2=2 \left(n-x\right),F=\frac{m_2p}{m_1 \left(1-p\right)} \end{gather} ただし、$f_{m1,m2} \left(x\right)$ は、自由度 $ \left(m_1,m_2\right)$ の $\mathrm{F}$分布の確率密度関数とする。

期待値

\begin{align} E \left(X\right)=np \end{align}

分散

\begin{align} V \left(X\right)=np \left(1-p\right) \end{align}

最頻値

\begin{align} Mo \left(X\right)= \left\{\begin{matrix} \left(n+1\right)p-1, \left(n+1\right)p& \left(n+1\right)p\in\boldsymbol{N}\\ \left\lceil \left(n+1\right)p\right\rceil& \left(n+1\right)p\notin\boldsymbol{N}\\\end{matrix}\right. \end{align} $x\in\boldsymbol{N}$ は整数であることを表す。 $ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。

確率母関数

\begin{align} G_X \left(\theta\right)= \left(1-p+p\theta\right)^n \end{align}

モーメント母関数

\begin{align} M_X \left(\theta\right)= \left(1-p+pe^\theta\right)^n \end{align}

再生性

二項分布には、再生性がある。

参考文献

  • 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.54
  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.101-104
  • 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.25-26
  • 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.29-31
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.30-33
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.82-84

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ