大数の法則と中心極限定理

公開日: 更新日:

【2023年4月3週】 【B000】数理統計学 【B060】標本分布

この記事をシェアする
  • B!
サムネイル画像

確率収束、平均収束、概収束、分布収束、連続性定理、連続写像の定理、スラツキーの定理の定義や内容の紹介、平均二乗収束と確率収束の関係、連続写像の定理(確率収束)、大数の弱法則などの証明が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

確率収束

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 ある定数 $c$ に対し、任意の正の数を $0 \lt \varepsilon$ として、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|X_n-c\right| \geq \varepsilon\right)=0} \end{align} または \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|X_n-c\right| \lt \varepsilon\right)=1} \end{align} が成り立つとき、 確率変数の列 $ \left\{X_n\right\}$ は $c$ に確率収束する converge in probability といい、 \begin{align} X_n\xrightarrow[]{p}c \end{align} と表す。

平均収束

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 ある定数 $c$ に対し、 \begin{align} \lim_{n\rightarrow\infty}{E \left( \left|X_n-c\right|^p\right)=0} \end{align} が成り立つとき、 確率変数の列 $ \left\{X_n\right\}$ は $c$ に平均 $p$ 乗収束 convergence in p-th mean する といい、 \begin{align} E \left( \left|X_n-c\right|^p\right) \end{align} を平均 $p$ 乗誤差という。 特に、$p=2$ のとき \begin{align} \lim_{n\rightarrow\infty}{E \left( \left|X_n-c\right|^2\right)=0} \end{align} がよく用いられる。

概収束

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 \begin{align} P \left(\lim_{n\rightarrow\infty}{X_n}-c\right)=1 \end{align} が成り立つとき、 確率変数の列 $ \left\{X_n\right\}$ は $c$ に概収束する almost sure converge という。

平均二乗収束と確率収束の関係

【命題】
平均二乗収束と確率収束の関係
Relationship between Convergence in Mean Square and Convergence in Probability

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 $ \left\{X_n\right\}$ がある定数 $c$ に平均二乗収束する ならば、 $ \left\{X_n\right\}$ は $c$ に確率収束する。

証明法:チェビシェフの不等式を用いる方法

証明

$ \left\{X_n\right\}$ が $c$ に平均二乗収束するとき、 \begin{align} \lim_{n\rightarrow\infty}{E \left[ \left(X_n-c\right)^2\right]}=0 \end{align} チェビシェフの不等式より、 \begin{align} P \left( \left|X_n-c\right| \geq \varepsilon\right) \le \frac{E \left[ \left(X_n-c\right)^2\right]}{\varepsilon^2} \end{align} 両辺の $n\rightarrow\infty$ のときの極限を取ると、 \begin{align} 0 \le \lim_{n\rightarrow\infty}{P \left( \left|X_n-c\right| \geq \varepsilon\right)} \le \lim_{n\rightarrow\infty}{\frac{E \left[ \left(X_n-c\right)^2\right]}{\varepsilon^2}}=0 \end{align} したがって、はさみうちの原理より、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|X_n-c\right| \geq \varepsilon\right)=0} \end{align} $\blacksquare$

連続写像の定理(確率収束)

【定理】
連続写像の定理(確率収束)
Continuous Mapping Theorem

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 $c \neq 0$ を満たす任意の実数 $c$ について、関数 $f \left( \cdot \right)$ が $c$ において連続ならば、 \begin{align} X_n\xrightarrow[]{p}c\Rightarrow f \left(X_n\right)\xrightarrow[]{p}f \left(c\right) \end{align} が成り立つ。

証明

証明

任意の正の数 $0 \lt \varepsilon$ に対し、ある正の数 $0 \lt \delta$ が存在し、$ \left|X_n-c\right| \le \delta$ ならば、 \begin{gather} \left|f \left(X_n\right)-f \left(c\right)\right| \le \varepsilon\\ P \left( \left|X_n-c\right| \le \delta\right) \le P \left( \left|f \left(X_n\right)-f \left(c\right)\right| \le \varepsilon\right)\\ P \left( \left|X_n-c\right| \gt \delta\right) \geq P \left( \left|f \left(X_n\right)-f \left(c\right)\right| \gt \varepsilon\right) \end{gather} よって、この極限値を取ると、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|f \left(X_n\right)-f \left(c\right)\right| \gt \varepsilon\right) \le }\lim_{n\rightarrow\infty}{P \left( \left|X_n-c\right| \gt \delta\right)}=0 \end{align} $\blacksquare$

大数の弱法則

【定理】
大数の弱法則
Weak Law of Large Numbers

平均と分散がそれぞれ $\mu$ と $\sigma^2$ である任意の母集団分布 $\mathrm{P} \left(\mu,\sigma^2\right)$ からの大きさ $n$ の無作為標本 \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} について 標本平均を \begin{align} {\bar{X}}_n=\frac{1}{n}\sum_{i=1}^{n}X_i \end{align} とすると、 $n$ が十分に大きければ($n\rightarrow\infty$)、標本平均は真の平均に確率収束する すなわち、任意の正の数 $0 \lt \varepsilon$ に対して、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|{\bar{X}}_n-\mu\right| \geq \varepsilon\right)}=0 \end{align} が成り立つ。

証明法:チェビシェフの不等式を用いる方法

証明

標本平均の期待値と分散の公式より、 \begin{gather} E \left({\bar{X}}_n\right)=\mu\\ V \left({\bar{X}}_n\right)=\frac{\sigma^2}{n} \end{gather} チェビシェフの不等式 $P \left( \left|X-\mu\right| \geq \varepsilon\right) \le \frac{\sigma^2}{\varepsilon^2}$ より、 \begin{gather} P \left\{ \left|{\bar{X}}_n-E \left({\bar{X}}_n\right)\right| \geq \varepsilon\right\} \le \frac{V \left({\bar{X}}_n\right)}{\varepsilon^2}\\ P \left( \left|{\bar{X}}_n-\mu\right| \geq \varepsilon\right) \le \frac{\sigma^2}{n\varepsilon^2} \end{gather} したがって、両辺の $n\rightarrow\infty$ のときの極限を取ると、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|{\bar{X}}_n-\mu\right| \geq \varepsilon\right)} \le \lim_{n\rightarrow\infty}{\frac{\sigma^2}{n\varepsilon^2}}=0 \end{align} 確率の公理 $0 \le P \left(A\right)$ より、 \begin{align} 0 \le \lim_{n\rightarrow\infty}{P \left( \left|{\bar{X}}_n-\mu\right| \geq \varepsilon\right)} \le 0 \end{align} はさみうちの原理により、 \begin{align} \lim_{n\rightarrow\infty}{P \left( \left|{\bar{X}}_n-\mu\right| \geq \varepsilon\right)}=0 \end{align} よって、確率収束の定義式を満たすので、 \begin{align} {\bar{X}}_n\xrightarrow[]{p}\mu \end{align} $\blacksquare$

分布収束

確率変数の列 $\boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\}$ と確率変数 $X$ の分布関数をそれぞれ \begin{align} F_n \left(x\right)=P \left(X_n \le x\right) \quad F \left(x\right)=P \left(X \le x\right) \end{align} とし、 $F \left(x\right)$ の連続点で \begin{align} \lim_{n\rightarrow\infty}{F_n \left(x\right)=F \left(x\right)} \end{align} が成り立つとき、 確率変数の列 $ \left\{X_n\right\}$ は、確率変数 $X$ に分布収束 converge in distribution、もしくは、法則収束する converge in law といい、 $X_n\xrightarrow[]{d}X \quad X_n\xrightarrow[]{d}F \left(x\right)$
または、
$X_n\xrightarrow[]{L}X \quad X_n\xrightarrow[]{L}F \left(x\right)$
と表す。 また、このときの $X$ の分布を $ \left\{X_n\right\}$ の漸近分布、または極限分布 といい、 $ \left\{X_n\right\}$ は、漸近的に、確率変数 $X$ の確率分布に従う ということもある。 収束先の分布が標準正規分布 $\mathrm{N} \left(0,1\right)$ や $\chi^2$分布 $\chi^2 \left(n\right)$ などのときは、 \begin{align} X_n\xrightarrow[]{d}\mathrm{N} \left(0,1\right) \quad X_n\xrightarrow[]{d}\chi^2 \left(n\right) \end{align} と表す。

連続性定理

【定理】
連続性定理
Continuity Theorem

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} について、 $X_n$ と確率変数 $X$ のモーメント母関数 \begin{align} M_{X_n} \left(\theta\right) \quad M_X \left(\theta\right) \end{align} が区間 $ \left(-h,h\right)$ で共に存在するとき、 確率変数の列 $ \left\{X_n\right\}$ が確率変数 $X$ に分布収束する必要十分条件は、 すべての $\theta\in \left(-h,h\right)$ において、$\lim_{n\rightarrow\infty}{M_{X_n} \left(\theta\right)}=M_X \left(\theta\right)$ である。

確率収束と分布収束の関係

【定理】
確率収束と分布収束の関係
Relationship between Converge in Probability and Converge in Distribution

確率変数の列 \begin{align} \boldsymbol{X}_\boldsymbol{n}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} について、 (i)$ \left\{X_n\right\}$ が確率変数 $X$ に確率収束するとき、$ \left\{X_n\right\}$ は $X$ に分布収束する \begin{align} X_n\xrightarrow[]{p}X\Rightarrow X_n\xrightarrow[]{d}X \end{align} (ii)$ \left\{X_n\right\}$ が定数 $a$ に分布収束するとき、$ \left\{X_n\right\}$ は $a$ に確率収束する \begin{align} X_n\xrightarrow[]{d}a\Rightarrow X_n\xrightarrow[]{p}a \end{align}

【定理】連続写像の定理(分布収束)

【定理】
連続写像の定理(分布収束)
Continuous Mapping Theorem

確率変数の列 \begin{align} \boldsymbol{X}_n= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} に関して、 関数 $g \left( \cdot \right)$ が連続な関数ならば、 \begin{align} X_n\xrightarrow[]{d}X\Rightarrow g \left(X_n\right)\xrightarrow[]{d}g \left(X\right) \end{align} が成り立つ。

2つの確率変数列の関数の確率収束

【定理】
2つの確率変数列の関数の確率収束
Convergence in Probability of Functions of Two Random Variables

2つの確率変数 $X,Y$ の列 \begin{align} \boldsymbol{X}_\boldsymbol{n}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}_\boldsymbol{n}= \left\{Y_1,Y_2, \cdots ,Y_n\right\} \end{align} について、 $ \left\{X_n\right\}$ が定数 $a \neq 0$ に確率収束し、$ \left\{Y_n\right\}$ が定数 $b$ に確率収束する、すなわち、 \begin{align} X_n\xrightarrow[]{p}a \quad Y_n\xrightarrow[]{p}b \end{align} のとき、 (i) \begin{align} X_n+Y_n\xrightarrow[]{p}a+bc \end{align} (ii) \begin{align} X_nY_n\xrightarrow[]{p}ab \end{align} (iii) \begin{align} \frac{1}{X_n}\xrightarrow[]{p}\frac{1}{a} \end{align} が成り立つ。

スラツキーの定理

【定理】
スラツキーの定理
Slutzky’s Theorem

2つの確率変数 $X,Y$ の列 \begin{align} \boldsymbol{X}_\boldsymbol{n}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}_\boldsymbol{n}= \left\{Y_1,Y_2, \cdots ,Y_n\right\} \end{align} と $c \neq 0$ を満たす任意の実数 $c$ について、 $ \left\{X_n\right\}$ が確率変数 $X$ に分布収束し、$ \left\{Y_n\right\}$ が $c$ に確率収束する、すなわち、 \begin{align} X_n\xrightarrow[]{d}X \quad Y_n\xrightarrow[]{p}c \end{align} のとき、 (i)和の漸近分布 \begin{align} X_n+Y_n\xrightarrow[]{d}X+c \end{align} (ii)積の漸近分布 \begin{align} X_nY_n\xrightarrow[]{d}cX \end{align} (iii)比の漸近分布 \begin{align} \frac{X_n}{Y_n}\xrightarrow[]{d}\frac{X}{c} \end{align} が成り立つ。

中心極限定理

【定理】
中心極限定理
Central Limit Theorem

平均と分散がそれぞれ $\mu$ と $\sigma^2$ である任意の母集団分布 $\mathrm{P} \left(\mu,\sigma^2\right)$ からの大きさ $n$ の無作為標本 \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} について、 標本平均を標準化した値を \begin{align} Z=\frac{\sqrt n \left({\bar{X}}_n-\mu\right)}{\sigma} \end{align} とすると、 確率変数 $X_i \left(i=1,2, \cdots ,n\right)$ のモーメント母関数が存在し、3回微分可能
かつ
それが連続である
ならば、 標本平均を標準化した値は、標準正規分布 $\mathrm{N} \left(0,1\right)$ に分布収束する、すなわち、 \begin{align} Z\xrightarrow[]{d}N \left(0,1\right) \end{align} が成り立つ。

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.182-190
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.94-101
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.130-140

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ