条件付き確率とベイズの定理

公開日: 更新日:

【2023年3月1週】 【B000】数理統計学 【B010】確率と集合

この記事をシェアする
  • B!
サムネイル画像

本稿では、確率論の基本事項である条件付き確率とベイズの定理についてまとめています。条件付き確率の基本性質、確率の乗法定理、全確率の定理、ベイズの定理などの定義や意味の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

条件付き確率

ある試行に関して確率の計算を行なうには、その試行についての知識、あるいは情報から、標本空間、事象となるその部分集合、そしてその確率が分からなければならない。もちろんその知識、あるいは情報が変われば確率もまた変わるわけである。ここでは、事象Aの確率が、事象Bが起こったという新たな情報が加わったときどのように変わるかを考えてみる。

たとえば、サイコロを投げたとき、6が出る確率は \begin{gather} \frac{1}{6} \end{gather} である。 しかし、出た目は奇数であると知らされた場合、出た目が6である確率は0である。つまり奇数が出たという新しい情報を知ることにより、出た目が6であるという事象の確率が変わったのである。このように、ある事象Bが起こったと分かっている場合に、事象Aが起こる確率を、事象Bを与えたときの事象Aの条件付き確率 conditional probability of A given B と呼び、 \begin{gather} P \left(A\middle| B\right)=\frac{P \left(A \cap B\right)}{P \left(B\right)} \quad 0 \lt P \left(B\right) \end{gather} で表す。 ただし、$0 \lt P \left(B\right)$ のときのみに定義され、$P \left(B\right)=0$ のときは、条件付き確率は定義されない。

「事象Bを与えた」とは、事象Bが起こることが確実である、あるいは事象Bが起こったという確かな情報を有していることを意味している。条件付き確率は、この情報を利用して、標本空間 $\Omega$ のなかに制約を加えた「新たな標本空間」 \begin{gather} \Omega= \left\{1,2,3,4,5,6\right\}\Rightarrow \left.\Omega\right|B= \left\{1,3,5\right\} \end{gather} を構成し、それに基づいて新たな確率空間を構成したものといえる。

条件付き確率の基本性質

条件付き確率には、次のような基本性質がある。これらは、一般的な確率の場合と同様の性質である。

【定理】
条件付き確率の基本性質
Basic Properties of Conditional Probability

事象 $A,B_1,B_2, \cdots $ について、標本空間を $\Omega$ とし、 \begin{gather} 0 \lt P \left(A\right) \end{gather} のとき、 (i) \begin{align} P \left(\Omega\middle| A\right)=1 \end{align}

(ii)条件付き確率は0以上、1以下 \begin{align} 0 \le P \left(B\middle| A\right) \le 1 \end{align}

(iii)$B_1 \cap B_2=\emptyset$ ならば、 \begin{align} P \left(B_1 \cup B_2\middle| A\right)=P \left(B_1\middle| A\right)+P \left(B_2\middle| A\right) \end{align}

(iv)すべての $i \neq j$ で $B_i \cap B_j=\emptyset$ ならば、 \begin{align} P \left(\bigcup_{i=1}^{\infty}B_i\middle| A\right)=\sum_{i=1}^{\infty}{P \left(B_i\middle| A\right)} \end{align}

(v) \begin{align} P \left(B^C\middle| A\right)=1-P \left(B\middle| A\right) \end{align}

(vi) \begin{align} P \left(B_1 \cup B_2\middle| A\right)=P \left(B_1\middle| A\right)+P \left(B_2\middle| A\right)-P \left(B_1 \cap B_2\middle| A\right) \end{align}

(vii) \begin{align} P \left(B\middle|\Omega\right)=P \left(B\right) \end{align}

(viii)$A \cap B=\emptyset$ ならば、 \begin{align} P \left(B\middle| A\right)=0 \end{align}

(ix)$A\subset B$ ならば、 \begin{align} P \left(B\middle| A\right)=1 \end{align}

(x)$B\subset A$ ならば、 \begin{align} P \left(B\right) \le P \left(B\middle| A\right) \end{align}

確率の乗法定理

条件付き確率の定義式より、条件付き確率 $P \left(B\middle| A\right)$ と周辺確率 $P \left(A\right)$ が与えられれば、積事象 $A \cap B$ の確率 $P \left(A \cap B\right)$ は \begin{gather} P \left(A \cap B\right)=P \left(B\middle| A\right) \cdot P \left(A\right) \end{gather} と書けることがわかる。 この式を確率の乗法定理 multiplication theorem on probability という。なお、確率 $P \left(A \cap B\right)$ に対して、乗法定理の表現方法として、 \begin{gather} P \left(A \cap B\right)=P \left(B\middle| A\right) \cdot P \left(A\right) \quad P \left(A \cap B\right)=P \left(A\middle| B\right) \cdot P \left(B\right) \end{gather} の2つの形式が得られる。 このことからわかるように、一般に、確率 $P \left(A \cap B\right)$ に対する乗法公式にはその表現に一意性がない。

一般に、$n$ 個の事象 \begin{gather} A_1,A_2, \cdots ,A_n \end{gather} があるとき、 積事象 \begin{gather} A_1 \cap A_2 \cap \cdots \cap A_n \end{gather} の確率 \begin{gather} P \left(A_1 \cap A_2 \cap \cdots \cap A_n\right) \end{gather} は条件付き確率の積として \begin{gather} P \left(A_1 \cap A_2 \cap \cdots \cap A_n\right)=P \left(A_n\middle| A_1 \cap A_2 \cap \cdots \cap A_{n-1}\right) \cdots P \left(A_2\middle| A_1\right) \cdot P \left(A_1\right) \end{gather} のように表すことができる。 これを一般乗法定理 general multiplication theorem、あるいは連鎖公式 cliain rule という。

全確率の定理

まず次のような実験を考えてみる。まったく同じ形をした箱 $A_1$ と箱 $A_2$ があり、箱 $A_1$ の中には黒ボール1個、赤ボール2個が入っていて、箱 $A_2$ には黒ボール1個、赤ボール3個入っている。ボールはどれも同じ形である。最初にどちらかの箱を無作為に選び、次にその選んだ箱からボールを1つ取り出す。このときの選ばれたボールが黒である確率を求める。

事象 $B$ を選ばれたボールが黒である事象とし、事象 $A_1$ を箱 $A_1$ が選ばれた事象、$A_2$ を箱 $A_2$ が選ばれた事象とする。事象 $B$ が起こるということは、箱 $A_1$ を選びそこから黒ボールを取り出したか、または箱 $A_2$ を選びそこから黒ボールを取リ出したかのどちらかが起こったということである。つまり $A_1 \cap B$ か $A_2 \cap B$ のどちらかが起こったということである。ここで $A_1 \cap B$ と $A_2 \cap B$ は同時に起こり得ないので互いに排反な事象である。

確率の基本性質により、 \begin{gather} P \left(B\right)=P \left(A_1 \cap B\right)+P \left(A_2 \cap B\right) \end{gather} $P \left(A_1 \cap B\right),P \left(A_2 \cap B\right)$ は乗法定理を使って、 \begin{gather} P \left(A_1 \cap B\right)=P \left(A_1\right) \cdot P \left(B\middle| A_1\right)=\frac{1}{2}\times\frac{1}{3}=\frac{1}{6}\\ P \left(A_2 \cap B\right)=P \left(A_2\right) \cdot P \left(B\middle| A_2\right)=\frac{1}{2}\times\frac{1}{4}=\frac{1}{8} \end{gather} よって、 \begin{gather} P \left(B\right)=\frac{1}{6}+\frac{1}{8}=\frac{7}{24} \end{gather}

標本空間の分割

上の事象 $A_1,A_2$ のように互いに排反であり、その和が標本空間であるような事象を標本空間の分割という。一般には次のようになる。

【定義】
標本空間の分割
Partition

事象 $A_1,A_2,A_3, \cdots $ について、すべての事象が互いに排反であり、かつ、すべての事象の和集合が標本空間に等しい、すなわち、 すべての $i \neq j$ に対し、 \begin{align} A_i \cap A_j=\emptyset \quad \mathrm{and} \quad \bigcup_{i=1}^{\infty}A_i=\Omega \end{align} が成り立つとき、 事象 $A_1,A_2,A_3, \cdots $ は標本空間 $\Omega$ の分割であるという。

全確率の定理

このとき、次の定理が成り立つ。

【定理】
全確率の定理
Total Probability Rule

事象 $A_1,A_2,A_3, \cdots $ が標本空間 $\Omega$ の分割であり、$0 \lt P \left(A_i\right)$ のとき、事象 $B$ に対して、 \begin{align} P \left(B\right)=\sum_{i=1}^{\infty}{P \left(A_i\right) \cdot P \left(B\middle| A_i\right)} \end{align} が成り立つ。

【例題】
ある工場では、3つの機械 $A,B,C$ で製品を作っている。機械 $A$ で作った製品の中には10%、機械 $B$ には20%、機械 $C$ には5%の不良晶ができるという。いま、この工場では50%の製品を機械 $A$ で、30%を機械 $B$ で、そして20%を機械 $C$ で作っているとするとき、できあがった製品を1つ取リ出したとき、それが不良品である確率を求める。

事象 $A$ =機械 $A$ で作られる、$B$ =機械 $B$ で作られる、$C$ =機械 $C$ で作られる、$D$ =不良品とすると、 \begin{gather} P \left(A\right)=0.5 \quad P \left(B\right)=0.3 \quad P \left(C\right)=0.2\\ P \left(D\middle|A\right)=0.1 \quad P \left(D\middle|B\right)=0.2 \quad P \left(D\middle|C\right)=0.05 \end{gather} \begin{align} P \left(D\right)&=P \left(A\right) \cdot P \left(D\middle|A\right)+P \left(B\right) \cdot P \left(D\middle|B\right)+P \left(C\right) \cdot P \left(D\middle|C\right)\\ &=0.5 \cdot 0.1+0.3 \cdot 0.2+0.2 \cdot 0.05\\ &=0.12 \end{align}

ベイズの定理

ここで全確率の定理の例に戻って、今度は取り出されたボールが黒であると知らされたとき、選ばれた箱が $A_1$ である確率を考えてみる。条件付き確率の定義により求める確率は、 \begin{align} P \left(A_1\middle| B\right)&=\frac{P \left(A_1 \cap B\right)}{P \left(B\right)}\\ &=\frac{P \left(A_1 \cap B\right)}{P \left(B\middle| A_1\right)+P \left(B\middle| A_2\right)}\\ &=\frac{\frac{1}{6}}{\frac{7}{24}}\\ &=\frac{4}{7} \end{align} つまり、箱 $A_1$ が選ばれる確率が、黒ボールが取り出されたという情報を得たことによって $\frac{1}{2}$ から $\frac{4}{7}$ に変わったのである。

一般に、全確率の定理と確率の乗法定理を用いると、次のベイズの定理が成り立つ。

【定理】
ベイズの定理
Bayes’ Theorem

事象 $A_1,A_2,A_3, \cdots $ が標本空間 $\Omega$ の分割であり、$0 \lt P \left(A_i\right)$ のとき、事象 $B$ に対して、$0 \lt P \left(B\right)$ ならば \begin{align} P \left(A_i\middle| B\right)=\frac{P \left(A_i\right) \cdot P \left(B\middle| A_i\right)}{\sum_{j=1}^{\infty}{P \left(A_j\right) \cdot P \left(B\middle| A_j\right)}} \end{align} が成り立つ。

この式において、確率 $P \left(A_i\right)$ を(事象 $B$ が起きる前の)事象 $A_i$ の事前確率 prior probability、または先験確率といい、条件付き確率 $P \left(A_i\middle| B\right)$ を(事象 $B$ が起きた後での)事象 $A_i$ の事後確率 posterior probability という。

また、条件付き確率 \begin{gather} P \left(A_i\middle| B\right) \end{gather} 尤度 likelihood \begin{gather} \sum_{j=1}^{\infty}{P \left(A_j\right) \cdot P \left(B\middle| A_j\right)} \end{gather} 周辺尤度 marginal likelihood ということがある。

例題

証人が車の色を証言するとき、実際に赤い色の車を見た場合、赤と正しく答える確率が0.8、実際には他の色の車を見たのに赤と答える確率が0.4だとする。いま、車の3割が赤であるとすると、証人が赤であると答えたとき、実際は他の色である確率を求める。

事象$R$=実際に赤の車である、事象$S$=証人が赤であると答える、とすると、 \begin{align} P \left(R^C\middle| S\right)&=\frac{P \left(R^C \cap S\right)}{P \left(S\right)}\\ &=\frac{P \left(S\middle| R^C\right) \cdot P \left(R^C\right)}{P \left(S\middle| R\right) \cdot P \left(R\right)+P \left(S\middle| R^C\right) \cdot P \left(R^C\right)}\\ &=\frac{0.4 \cdot 0.7}{0.8 \cdot 0.3+0.4 \cdot 0.7}\\ &=0.5385 \end{align}

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.13-15, p22-27
  • 東京大学教養学部統計学教室 編. 基礎統計学 1 統計学入門. 東京大学出版会, 1991, p.81-85
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.29-32

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ