確率変数と分布関数-あるノマドの知の旅路～数学・統計学への道

本稿では、確率変数と分布関数についてまとめています。累積分布関数、累積分布関数を用いた確率の計算、離散型確率変数と確率関数、連続型確率変数と確率密度関数の定義や性質の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

確率変数と確率分布

コインを投げて表裏をみる実験のときの標本空間を \begin{gather} \Omega= \left\{\omega_1,\omega_2\right\}\\ \omega_1 \leftrightarrow\mathrm{top} \quad \omega_2 \leftrightarrow\mathrm{bottom} \end{gather} とし、この標本空間に \begin{gather} P \left[ \left\{\omega_1\right\}\right]=\frac{1}{2} \quad P \left[ \left\{\omega_2\right\}\right]=\frac{1}{2} \end{gather} なる確率 $P$ が与えられているとする

このとき表の出た回数を考えてみると、表が出たら1であり裏であれば0である。すなわち、$\omega_1$ に1と $\omega_2$ に0を対応させているのである。

今度は、表が出たら10円もらい、裏が出たら10円払うというゲームの場合には、$\omega_1$ には $+10$ を、$\omega_2$ には $-10$ を対応させていると考えられる。つまり、標本空間の各標本点にある実数を対応させるような関数を考えているわけである。次のように関数 $X$ を定義すると、表の出る数の場合になり、関数 $T$ は上のゲームの場合になる。 \begin{gather} X \left(\omega_1\right)=1 \quad X \left(\omega_2\right)=0\\ T \left(\omega_1\right)=+10 \quad T \left(\omega_2\right)=-10 \end{gather}

$X$ の取りうる値の集合は \begin{gather} S_X= \left\{0,1\right\} \end{gather} $T$ の取りうる値の集合は \begin{gather} S_T= \left\{-10,10\right\} \end{gather} である。たとえば、$A= \left\{0\right\}$ で $X\in A$ ということは $X$ の値が $0$ ということ、つまり裏が出るということである。このように標本空間の各点に実数を対応させる関数を確率変数という。

ここで確率変数の取リうる値についての確率というものを考えてみる。たとえば、上の $X=1$ である確率であるとか $T=10$ である確率とかである。事象 $A$ に対しての $X\in A$ の確率を $P_X \left(A\right)$ で表わすとすると、 \begin{gather} P_X \left[ \left\{1\right\}\right]=P \left\{\omega:X \left(\omega\right)=1\right\}=P \left[ \left\{\omega_1\right\}\right]=\frac{1}{2}\\ P_X \left[ \left\{0\right\}\right]=P \left\{\omega:X \left(\omega\right)=0\right\}=P \left[ \left\{\omega_2\right\}\right]=\frac{1}{2} \end{gather} 同様に、 \begin{gather} P_T \left[ \left\{10\right\}\right]=P \left\{\omega:X \left(\omega\right)=10\right\}=P \left[ \left\{\omega_1\right\}\right]=\frac{1}{2}\\ P_T \left[ \left\{-10\right\}\right]=P \left\{\omega:X \left(\omega\right)=-10\right\}=P \left[ \left\{\omega_2\right\}\right]=\frac{1}{2} \end{gather} これらのことを一般的に言うと次のようになる。

標本空間 $\Omega$ とその確率 $P$ が与えられているとき、その標本空間の点 $\omega$ に実数を対応させる関数 \begin{gather} Y \left(\omega\right) \end{gather} を確率変数 random variable と呼び、確率変数が実際に取る値を実現値と呼ぶ。

そのとき、事象 $A\subset\boldsymbol{R}$ に対する $Y\in A$ なる確率は、 \begin{gather} P_Y \left(A\right)=P \left[ \left\{\omega:Y \left(\omega\right)\in A\right\}\right] \end{gather} で与えられる。このようこして得られた $P_Y$ を確率変数 $Y$ の確率分布 probability distribution という。確率変数は、その確率分布 $P_Y$ によって特徴づけられる。

同様に、標本空間から $\boldsymbol{R}^\boldsymbol{n}$ への関数を$n$ 次元確率変数、または確率ベクトル n-dimensional randm vector という。

例題

サイコロを投げて出た目を観察するという試行の場合、標本空間 \begin{gather} \Omega= \left\{1,2,3,4,5,6\right\}\\ P \left[ \left\{i\right\}\right]=\frac{1}{6} \quad i=1,2,3,4,5,6 \end{gather} と与えられているとき、（a）関数 $X$ を \begin{gather} X \left(i\right)=i \quad i=1,2,3,4,5,6 \end{gather} とすると $X$ は出た目を表わす確率変数で、 \begin{gather} P_X \left[ \left\{i\right\}\right]=P \left[ \left\{i\right\}\right]=\frac{1}{6} \end{gather}

（b）関数 $W$ を \begin{gather} W \left(i\right)= \left\{\begin{matrix}1&i=1\\0&i=2,3,4,5,6\\\end{matrix}\right. \end{gather} とすると $X$ は1が出たかどうかを示す確率変数で、 \begin{gather} P_W \left[ \left\{1\right\}\right]=P \left[ \left\{i:W \left(i\right)=1\right\}\right]=P \left[ \left\{1\right\}\right]=\frac{1}{6}\\ P_W \left[ \left\{0\right\}\right]=P \left[ \left\{i:W \left(i\right)=0\right\}\right]=P \left[ \left\{2,3,4,5,6\right\}\right]=\frac{5}{6} \end{gather}

（c）関数 $Z$ を \begin{gather} Z \left(i\right)=c \quad i=1,2,3,4,5,6 \end{gather} $c$ はある定数とすると \begin{gather} P_Z \left[ \left\{c\right\}\right]=P \left[ \left\{i:Z \left(i\right)=c\right\}\right]=P \left[ \left\{1,2,3,4,5,6\right\}\right]=1 \end{gather} このように、常に定数であるような確率変数を定数確率変数 degenerate random variable ということがある。

累積分布関数

確率変数 $X$ の実数値関数 $F \left(x\right)$ のうち、すべての実数 $x$ に対し、 \begin{align} F \left(x\right)=P \left(X \le x\right) \end{align} を満たすものを確率変数 $X$ の累積分布関数 cumulative distribution function、または単に分布関数 distribution function という。これは、確率変数 $X$ が $x$ 以下の値を取る確率である。

分布関数は $\boldsymbol{R}$ から区間 $ \left[0,1\right]$ への関数 \begin{align} F_X:\boldsymbol{R}\rightarrow \left[0,1\right] \end{align} である。分布関数 $F_X$ が分かれば $X$ についての事象の確率は分かる。すなわち分布関数も前で定義した分布 $X$ と同様に確率変数$X$ を完全に特長づける。実際、確率変数の分布が分かれば、その分布関数は分かり、また分布関数が分かればその分布も分かる。

確率変数 $X$ の分布関数が $F \left(x\right)$ であるとき、しばしば、確率変数 $X$ は分布 $F$ に従う
X is distributed according to F と表現し、 \begin{align} X \sim F \end{align} と表すことが多い。

累積分布関数の基本性質

累積分布関数には、以下の性質がある。

【定理】
累積分布関数の基本性質
Basic Properties of Cumulative Distribution Function

（I）すべての $x\in\boldsymbol{R}$ に対し、 \begin{align} 0 \le F \left(x\right) \le 1 \end{align} （II）$x\rightarrow\pm\infty$ のときの極限値は、 \begin{align} \lim_{x\rightarrow-\infty}{F \left(x\right)}=0 \quad \lim_{x\rightarrow\infty}{F \left(x\right)}=1 \end{align} （III）単調非減少関数である \begin{align} a \lt b\Rightarrow F \left(a\right) \le F \left(b\right) \end{align} （IV）右側連続である \begin{align} \lim_{t\rightarrow x+0}{F \left(t\right)}=F \left(x\right) \end{align} 逆に、ある関数 $F \left(x\right)$ が分布関数となる必要十分条件は、性質（II）～（IV）を満たすことである。

証明

（I）確率の基本性質 $0 \le P \left(A\right) \le 1$ より、$A= \left(X \le x\right)$ であると考えると、 \begin{gather} 0 \le P \left(X \le x\right) \le 1\\ 0 \le F \left(x\right) \le 1 \end{gather} $\blacksquare$

（II）実数 $x$ に対し、$ \left\{x:X \le \infty\right\}=\Omega, \left\{x:X \le -\infty\right\}=\emptyset$ であることから、 \begin{gather} \lim_{x\rightarrow-\infty}{F \left(x\right)}=P \left(\emptyset\right)=0\\ \lim_{x\rightarrow\infty}{F \left(x\right)}=P \left(\Omega\right)=1 \end{gather} $\blacksquare$

（III）$a \lt b$ ならば、$ \left(-\infty, \left.a\right]\right.\subset \left(-\infty, \left.b\right]\right.$ なので、確率の基本性質 $A\subset B\Rightarrow P \left(A\right) \le P \left(B\right)$ より、 \begin{align} F \left(a\right)=P \left(X \le a\right) \le P \left(X \le b\right)=F \left(b\right) \end{align} $\blacksquare$

（IV）$ \left\{t_n\right\}$ を減少数列として、$\lim_{n\rightarrow\infty}{t_n}=x$ であるとすると、 \begin{align} \left(-\infty, \left.t_n\right]\right.\supset \left(-\infty, \left.t_{n+1}\right]\right.\supset \cdots \Rightarrow\bigcap_{n=1}^{\infty} \left(-\infty, \left.t_n\right]\right.= \left(-\infty, \left.x\right]\right. \end{align} したがって、 \begin{align} F \left(x\right)&=P \left(X \le x\right)\\ &=\lim_{n\rightarrow\infty}{P \left(X \le t_n\right)}\\ &=\lim_{n\rightarrow\infty}{F \left(t_n\right)}\\ &=\lim_{x\rightarrow+0}{F \left(x\right)} \end{align} $\blacksquare$

累積分布関数を用いた確率の計算

実数 $a,b$ が $a \lt b$ を満たすとき、確率変数 $X$ がある値を取る確率は、以下のように求めることができる。

【定理】
累積分布関数を用いた確率の計算
Calculating Probability with Cumulative Distribution Function

（i）$a$ より大きい値を取る確率 \begin{align} P \left(a \lt X\right)=1-F \left(a\right) \end{align} （ii）$a$ より大きく、$b$ 以下の値を取る確率 \begin{align} P \left(a \lt X \le b\right)=\ F \left(b\right)-F \left(a\right) \end{align} （iii）$a$ より小さい値を取る確率 \begin{align} P \left(X \lt a\right)=\lim_{x\rightarrow-0}{F \left(a\right)} \end{align} （iv）$a$ となる確率 \begin{align} P \left(X=a\right)=F \left(a\right)-\lim_{x\rightarrow-0}{F \left(a\right)} \end{align} （v）$a$ 以上、$b$ 以下の値を取る確率 \begin{align} P \left(a \le X \le b\right)=\ F \left(b\right)-F \left(a\right)+P \left(X=a\right) \end{align} （vi）$a$ 以上、$b$ より小さい値を取る確率 \begin{align} P(a \le X \lt b)=\ F(b)-F(a)-P(X=b) \end{align}

証明

（i）確率の基本性質 $P \left(A^C\right)=1-P \left(A\right)$ より、$A= \left(X \le x\right)$ であると考えると、 \begin{align} P \left(a \lt X\right)=1-P \left(X \le a\right)=1-F \left(a\right) \end{align} $\blacksquare$

（ii）分布関数の定義式より、 \begin{align} P \left(a \lt X \le b\right)=P \left(X \le b\right)-P \left(X \le a\right)=\ F \left(b\right)-F \left(a\right) \end{align} $\blacksquare$

（iii）$ \left\{t_n\right\}$ を増加数列として、$\lim_{n\rightarrow\infty}{t_n}=a$ であるとすると、 \begin{align} \left(-\infty, \left.t_n\right]\right.\subset \left(-\infty, \left.t_{n+1}\right]\right.\subset \cdots \Rightarrow\bigcup_{n=1}^{\infty} \left\{X \le t_n\right\}= \left\{X \lt a\right\} \end{align} したがって、 \begin{align} P \left(X \lt a\right)=\lim_{n\rightarrow\infty}{P \left(X \le t_n\right)}=\lim_{n\rightarrow\infty}{F \left(t_n\right)}=\lim_{x\rightarrow-0}{F \left(a\right)} \end{align} $\blacksquare$

（iv） \begin{align} P \left(X=a\right)=P \left(X \le a\right)-P \left(X \lt a\right)=F \left(a\right)-\lim_{x\rightarrow-0}{F \left(a\right)} \end{align} （v） \begin{align} P \left(a \le X \le b\right)&=P \left(X \le b\right)-P \left(X \le a\right)+P \left(X=a\right)\\ &=\ F \left(b\right)-F \left(a\right)+P \left(X=a\right) \end{align} $\blacksquare$

（vi） \begin{align} P \left(a \le X \lt b\right)&=P \left(X \le b\right)-P \left(X \le a\right)-P \left(X=b\right)\\ &=F \left(b\right)-F \left(a\right)-P \left(X=b\right) \end{align} $\blacksquare$

離散型確率変数と確率関数

離散型確率変数

確率変数 $X$ が有限個 \begin{gather} x_1,x_2, \cdots ,x_n \end{gather} または可算無限個 \begin{gather} x_1,x_2, \cdots \end{gather} の値をとるとき、その確率変数は離散型 discrete random variable であるという。

確率関数

離散型確率変数に関して、$X=x$ となる確率を確率変数 $X$ の確率質量関数 probability mass function、または単に確率関数 probability function といい、$x$ に関する関数 $f \left(x\right)$ として、 \begin{align} f \left(x\right)=P \left(X=x\right) \quad x\in\boldsymbol{R} \end{align} で表す。離散型確率変数の分布は、確率関数によって与えられ、$x$ が取り得る値でないときは、 \begin{align} f \left(x\right)=0 \end{align} と定義される。すなわち、$X$ の定義域を $\boldsymbol{X}= \left\{x_1,x_2, \cdots \right\}$ とすると、 \begin{align} f \left(x\right)= \left\{\begin{matrix}P \left(X=x\right)&x\in\boldsymbol{X}\\0&x\notin\boldsymbol{X}\\\end{matrix}\right. \end{align}

確率関数の性質

確率関数は、確率の公理を満たすため、すべての $x\in\boldsymbol{R}$ に関して、
（i）0以上の値である \begin{align} 0 \le f \left(x\right) \end{align} （ii）$X$ の取りうる値に対応する確率の総和は1 \begin{align} \sum_{-\infty}^{\infty}f \left(x\right)=1 \end{align}

任意の事象の確率

また、任意の集合 $A\in\boldsymbol{R}$ について、その確率は、 \begin{align} P \left(X\in A\right)=\sum_{x\in A} f \left(x\right) \end{align} で与えられる。例えば、$X$ が $a$ 以上、$b$ 以下の値を取る確率は、 \begin{align} P \left(a \le X \le b\right)=\sum_{a}^{b}f \left(x\right) \end{align} である。

確率関数と分布関数の関係

確率関数を用いると、累積分布関数は、 \begin{align} F \left(x\right)=\sum_{-\infty}^{x}f \left(x\right) \end{align} と表すことができる。

連続型確率変数と確率密度関数

確率変数 $X$ について、次式のように、すべての $x$ で、 \begin{align} F \left(x\right)=\int_{-\infty}^{x}f \left(t\right)dt \end{align} を満たす非負の関数 $f \left(x\right)$ が存在するとき、 \begin{gather} X \end{gather} を連続型確率変数 continuous random variable といい、 \begin{gather} f \left(x\right) \end{gather} を $X$ の確率密度関数 probability density function という。

確率密度関数の性質

確率密度関数は、確率の公理を満たすため、すべての $x\in\boldsymbol{R}$ に関して、
（i）0以上の値である \begin{align} 0 \le f \left(x\right) \end{align} （ii）$X$ の取りうる値に対応する確率の総和は1 \begin{align} \int_{-\infty}^{\infty}f \left(x\right)dx=1 \end{align}

任意の事象の確率

また、任意の集合 $A\in\boldsymbol{R}$ について、その確率は、 \begin{align} P \left(X\in A\right)=\int_{x\in A} f \left(x\right)dx \end{align} で与えられる。

また、すべての実数 $c$ に対し、 \begin{align} P \left(X=c\right)=\int_{c}^{c}f \left(x\right)dx=0 \end{align} これにより、区間 $A= \left(a,b\right), \left(a\right., \left.b\right], \left[a\right., \left.b\right), \left[a,b\right]$ についての確率は、 \begin{align} P \left(a \lt X \lt b\right)&=P \left(a \lt X \le b\right)\\ &=P \left(a \le X \lt b\right)\\ &=P \left(a \le X \le b\right)\\ &=\int_{a}^{b}f \left(x\right)dx \end{align} である。

確率密度関数と分布関数の関係

連続型確率変数の分布関数は全実数で連続である。さらに、確率密度関数が連続な点 $x$ で分布関数は微分可能で、 \begin{align} f \left(x\right)=\frac{d}{dx}F \left(x\right) \end{align} という関係が成り立つ。

参考文献

野田一雄, 宮岡悦良著. 入門・演習数理統計. 共立出版, 1990, p.30-44
竹村彰通著. 現代数理統計学. 創文社, 1991, p.7-12
東京大学教養学部統計学教室編. 基礎統計学 1 統計学入門. 東京大学出版会, 1991, p.87-94
黒木学著. 数理統計学：統計的推論の基礎. 共立出版, 2020, p.37-43

確率変数と分布関数

確率変数と確率分布

例題

累積分布関数

累積分布関数の基本性質

証明

累積分布関数を用いた確率の計算

証明

離散型確率変数と確率関数

離散型確率変数

確率関数

確率関数の性質

任意の事象の確率

確率関数と分布関数の関係

連続型確率変数と確率密度関数

確率密度関数の性質

任意の事象の確率

確率密度関数と分布関数の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

確率変数と分布関数

確率変数と確率分布

例題

累積分布関数

累積分布関数の基本性質

証明

累積分布関数を用いた確率の計算

証明

離散型確率変数と確率関数

離散型確率変数

確率関数

確率関数の性質

任意の事象の確率

確率関数と分布関数の関係

連続型確率変数と確率密度関数

確率密度関数の性質

任意の事象の確率

確率密度関数と分布関数の関係

参考文献

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

ブログアーカイブ