本稿では、二項分布の定義と概要についてまとめています。確率関数であることの証明、確率関数の導出、二項分布の正規近似(ド・モアブル=ラプラスの定理)、確率関数、累積分布関数、期待値・分散、確率母関数、モーメント母関数、最頻値、再生性の紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
二項分布
定義・意味
成功確率が $p$ のベルヌーイ試行を独立に $n$ 回行ったときの成功回数 \begin{gather} X \end{gather} が従う離散型確率分布を二項分布 binomial distribution と呼ぶ。
確率関数
確率関数 $f(x)$ は、 \begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather} で与えられる。
略記法
また、二項分布は、 \begin{align} \mathrm{B} \left(n,p\right) \end{align} と略記されることがある。
確率関数であることの証明
(i)すべての $x$ に関して、$P \left(x\right) \geq 0$
確率の基本性質 $0 \le p \le 1$ より、$0 \le 1-p$ なので、
\begin{align}
f \left(x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \geq 0
\end{align}
(ii)すべての確率の和が1
二項定理 $ \left(a+b\right)^n=\sum_{x=0}^{n}{{}_{n}C_xa^xb^{n-x}}$ において、$a=p,b=1-p$ とすると、
\begin{align}
\sum_{x=0}^{n}f \left(x\right)= \left\{p+ \left(1-p\right)\right\}^n=1
\end{align}
よって、確率関数の定義を満たしているため、確率関数である。
$\blacksquare$
確率関数の導出
(i)すべての $x$ に関して、$P \left(x\right) \geq 0$
$i$ 回目の試行で成功する事象を
\begin{align}
A_i
\end{align}
失敗する事象を
\begin{align}
A_i^C
\end{align}
とすると、
例えば、最初の $x$ 回が連続して成功し、残りの $n-x$ 回が連続して失敗する確率は、事象の独立性の定義から、
\begin{align}
P \left(A_1 \cap \cdots \cap A_x \cap A_{x+1}^C \cap \cdots \cap A_n^C\right)&=P \left(A_1\right) \cdots P \left(A_x\right) \cdot P \left(A_{x+1}^C\right) \cdots P \left(A_n^C\right)\\
&=p \cdots p \cdot \left(1-p\right) \cdots \left(1-p\right)\\
&=p^x \left(1-p\right)^{n-x}
\end{align}
$n$ 回のベルヌーイ試行のうち、$x$ 回が成功、$n-x$ 回が失敗となる組み合わせは、$1 \sim n$ の $n$ 個の数字の中から「成功」とする数字を $x$ 個選ぶ組み合わせの数と考えられるので、${}_{n}C_x$ 通りある。
したがって、求める確率は、 \begin{align} f \left(x\right)=P \left(X=x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \end{align} $\blacksquare$
【定理】二項分布の正規近似:ド・モアブル=ラプラスの定理
【定理】
二項分布の正規近似:ド・モアブル=ラプラスの定理
Normal Approximation to the Binomial Distribution: De Moivre–Laplace Theorem
確率変数 $X$ が二項分布 \begin{gather} X \sim B \left(n,p\right) \end{gather} に従うとき、 $X$ を標準化した値 \begin{gather} Z=\frac{X-np}{\sqrt{np \left(1-p\right)}} \end{gather} について、 標準正規分布の累積分布関数を $\Phi \left(z\right)$ とすると、 \begin{gather} \lim_{n\rightarrow\infty}{P \left[\frac{X-np}{\sqrt{np \left(1-p\right)}} \le z\right]}=\int_{-\infty}^{z}{\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}dz}=\Phi \left(z\right) \end{gather} が成り立つ。
連続修正
離散型確率変数の分布を連続型の分布で近似することから起こる誤差を改良するものとして、連続修正 continuity correction が使われることがある。
これは、$P \left(a \le X \le b\right)$ を \begin{gather} P \left(a-0.5 \le X \le b+0.5\right) \end{gather} としてから正規分布の近似を用いるものである。
つまり、 \begin{gather} P \left(a \le X \le b\right)\cong\Phi \left[\frac{b+0.5-np}{\sqrt{np \left(1-p\right)}}\right]-\Phi \left[\frac{a-0.5-np}{\sqrt{np \left(1-p\right)}}\right] \end{gather} で求める。
重要事項のまとめ
略記法
\begin{align} \mathrm{B} \left(n,p\right) \end{align}
パラメータ
\begin{gather} n= \left\{0,1, \cdots \right\}\\ 0 \le p \le 1 \end{gather}
確率関数
\begin{gather} f \left(x\right)= \left\{\begin{matrix}{}_{n}C_xp^x \left(1-p\right)^{n-x}&x=0,1, \cdots ,n\\0&\mathrm{other}\\\end{matrix}\right. \end{gather}
累積分布関数
\begin{gather} F \left(x\right)=\int_{F}^{\infty}{f_{m1,m2} \left(x\right)dx}\\ m_1=2 \left(x+1\right),m_2=2 \left(n-x\right),F=\frac{m_2p}{m_1 \left(1-p\right)} \end{gather} ただし、$f_{m1,m2} \left(x\right)$ は、自由度 $ \left(m_1,m_2\right)$ の $\mathrm{F}$分布の確率密度関数とする。
期待値
\begin{align} E \left(X\right)=np \end{align}
分散
\begin{align} V \left(X\right)=np \left(1-p\right) \end{align}
最頻値
\begin{align} Mo \left(X\right)= \left\{\begin{matrix} \left(n+1\right)p-1, \left(n+1\right)p& \left(n+1\right)p\in\boldsymbol{N}\\ \left\lceil \left(n+1\right)p\right\rceil& \left(n+1\right)p\notin\boldsymbol{N}\\\end{matrix}\right. \end{align} $x\in\boldsymbol{N}$ は整数であることを表す。 $ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。
確率母関数
\begin{align} G_X \left(\theta\right)= \left(1-p+p\theta\right)^n \end{align}
モーメント母関数
\begin{align} M_X \left(\theta\right)= \left(1-p+pe^\theta\right)^n \end{align}
再生性
二項分布には、再生性がある。
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.54
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.101-104
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.25-26
- 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.29-31
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.30-33
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.82-84
0 件のコメント:
コメントを投稿