二項分布の定義と概要-あるノマドの知の旅路～数学・統計学への道

二項分布の定義と概要

公開日：更新日：

本稿では、二項分布の定義と概要についてまとめています。確率関数であることの証明、確率関数の導出、二項分布の正規近似（ド・モアブル＝ラプラスの定理）、確率関数、累積分布関数、期待値・分散、確率母関数、モーメント母関数、最頻値、再生性の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

二項分布

定義・意味

成功確率が $p$ のベルヌーイ試行を独立に $n$ 回行ったときの成功回数 \begin{gather} X \end{gather} が従う離散型確率分布を二項分布 binomial distribution と呼ぶ。

確率関数

確率関数 $f(x)$ は、 \begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather} で与えられる。

略記法

また、二項分布は、 \begin{align} \mathrm{B} \left(n,p\right) \end{align} と略記されることがある。

確率関数であることの証明

証明

（i）すべての $x$ に関して、$P \left(x\right) \geq 0$
確率の基本性質 $0 \le p \le 1$ より、$0 \le 1-p$ なので、 \begin{align} f \left(x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \geq 0 \end{align} （ii）すべての確率の和が1
二項定理 $ \left(a+b\right)^n=\sum_{x=0}^{n}{{}_{n}C_xa^xb^{n-x}}$ において、$a=p,b=1-p$ とすると、 \begin{align} \sum_{x=0}^{n}f \left(x\right)= \left\{p+ \left(1-p\right)\right\}^n=1 \end{align} よって、確率関数の定義を満たしているため、確率関数である。 $\blacksquare$

確率関数の導出

導出

（i）すべての $x$ に関して、$P \left(x\right) \geq 0$
$i$ 回目の試行で成功する事象を \begin{align} A_i \end{align} 失敗する事象を \begin{align} A_i^C \end{align} とすると、例えば、最初の $x$ 回が連続して成功し、残りの $n-x$ 回が連続して失敗する確率は、事象の独立性の定義から、 \begin{align} P \left(A_1 \cap \cdots \cap A_x \cap A_{x+1}^C \cap \cdots \cap A_n^C\right)&=P \left(A_1\right) \cdots P \left(A_x\right) \cdot P \left(A_{x+1}^C\right) \cdots P \left(A_n^C\right)\\ &=p \cdots p \cdot \left(1-p\right) \cdots \left(1-p\right)\\ &=p^x \left(1-p\right)^{n-x} \end{align} $n$ 回のベルヌーイ試行のうち、$x$ 回が成功、$n-x$ 回が失敗となる組み合わせは、$1 \sim n$ の $n$ 個の数字の中から「成功」とする数字を $x$ 個選ぶ組み合わせの数と考えられるので、${}_{n}C_x$ 通りある。

したがって、求める確率は、 \begin{align} f \left(x\right)=P \left(X=x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \end{align} $\blacksquare$

【定理】二項分布の正規近似：ド・モアブル＝ラプラスの定理

【定理】
二項分布の正規近似：ド・モアブル＝ラプラスの定理
Normal Approximation to the Binomial Distribution: De Moivre–Laplace Theorem

確率変数 $X$ が二項分布 \begin{gather} X \sim B \left(n,p\right) \end{gather} に従うとき、 $X$ を標準化した値 \begin{gather} Z=\frac{X-np}{\sqrt{np \left(1-p\right)}} \end{gather} について、標準正規分布の累積分布関数を $\Phi \left(z\right)$ とすると、 \begin{gather} \lim_{n\rightarrow\infty}{P \left[\frac{X-np}{\sqrt{np \left(1-p\right)}} \le z\right]}=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}dz}=\Phi \left(z\right) \end{gather} が成り立つ。

連続修正

離散型確率変数の分布を連続型の分布で近似することから起こる誤差を改良するものとして、連続修正 continuity correction が使われることがある。

これは、$P \left(a \le X \le b\right)$ を \begin{gather} P \left(a-0.5 \le X \le b+0.5\right) \end{gather} としてから正規分布の近似を用いるものである。

つまり、 \begin{gather} P \left(a \le X \le b\right)\cong\Phi \left[\frac{b+0.5-np}{\sqrt{np \left(1-p\right)}}\right]-\Phi \left[\frac{a-0.5-np}{\sqrt{np \left(1-p\right)}}\right] \end{gather} で求める。

重要事項のまとめ

略記法

\begin{align} \mathrm{B} \left(n,p\right) \end{align}

パラメータ

\begin{gather} n= \left\{0,1, \cdots \right\}\\ 0 \le p \le 1 \end{gather}

確率関数

\begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather}

累積分布関数

\begin{gather} F \left(x\right)=\int_{F}^{\infty}{f_{m1,m2} \left(x\right)dx}\\ m_1=2 \left(x+1\right),m_2=2 \left(n-x\right),F=\frac{m_2p}{m_1 \left(1-p\right)} \end{gather} ただし、$f_{m1,m2} \left(x\right)$ は、自由度 $ \left(m_1,m_2\right)$ の $\mathrm{F}$分布の確率密度関数とする。

期待値

\begin{align} E \left(X\right)=np \end{align}

分散

\begin{align} V \left(X\right)=np \left(1-p\right) \end{align}

最頻値

\begin{align} Mo \left(X\right)= \left\{\begin{matrix} \left(n+1\right)p-1, \left(n+1\right)p& \left(n+1\right)p\in\boldsymbol{N}\\ \left\lceil \left(n+1\right)p\right\rceil& \left(n+1\right)p\notin\boldsymbol{N}\\\end{matrix}\right. \end{align} $x\in\boldsymbol{N}$ は整数であることを表す。 $ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。

確率母関数

\begin{align} G_X \left(\theta\right)= \left(1-p+p\theta\right)^n \end{align}

モーメント母関数

\begin{align} M_X \left(\theta\right)= \left(1-p+pe^\theta\right)^n \end{align}

再生性

二項分布には、再生性がある。

参考文献

小寺平治著. 数理統計：明解演習. 共立出版, 1986, p.54
野田一雄, 宮岡悦良著. 入門・演習数理統計. 共立出版, 1990, p.101-104
竹村彰通著. 現代数理統計学. 創文社, 1991, p.25-26
稲垣宣生著. 数理統計学. 裳華房, 2003, p.29-31
久保川達也著, 新井仁之, 小林俊行, 斎藤毅, 吉田朋広編. 現代数理統計学の基礎. 共立出版, 2017, p.30-33
黒木学著. 数理統計学：統計的推論の基礎. 共立出版, 2020, p.82-84

二項分布の定義と概要

二項分布

定義・意味

確率関数

略記法

確率関数であることの証明

確率関数の導出

【定理】二項分布の正規近似：ド・モアブル＝ラプラスの定理

連続修正

重要事項のまとめ

略記法

パラメータ

確率関数

累積分布関数

期待値

分散

最頻値

確率母関数

モーメント母関数

再生性

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

二項分布の定義と概要

二項分布

定義・意味

確率関数

略記法

確率関数であることの証明

確率関数の導出

【定理】二項分布の正規近似：ド・モアブル＝ラプラスの定理

連続修正

重要事項のまとめ

略記法

パラメータ

確率関数

累積分布関数

期待値

分散

最頻値

確率母関数

モーメント母関数

再生性

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ブログアーカイブ