多項分布の周辺分布と共分散の導出

公開日:

【2023年4月1週】 【B000】数理統計学 【B050】多次元確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、①周辺確率関数の定義式を用いる方法、②モーメント母関数を用いる方法、③任意の事象を中心に意味を考える方法の3通りの方法で、多項分布の周辺分布が二項分布であることを証明しています。また、多項分布に従う確率変数どうしの共分散も導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

【定理】多項分布の周辺分布

【定理】
多項分布の周辺分布
Marginal Probability Distribution of Multinomial Distribution

確率変数ベクトル X={X1,X2,X3,,Xk} が、 多項分布 MN(n,p) に従うとき、 (i)Xi の周辺分布は、二項分布 XiB(n,pi) となる。 (ii)Xi+Xj(ij) の分布は、二項分布 Xi+XjB(n,pi+pj) となる。

証明法①:周辺確率関数の定義式を用いる方法

証明

(i)Xi の周辺分布
周辺確率関数の定義式 f(xi)=f(x) より、例えば、X1 について、 f(xi)=x2+x3+xk=nx1n!x1!xk!p1x1pkxk=n!x1!(nx1)!p1x1x2+x3+xk=nx1(nx1)!x2!xk!p2x2pkxk 多項定理 (p1+p2++pk)n=x1+x2++xk=nn!x1!x2!xk!p1n1p2n2pknk より、 f(xi)=n!x1!(nx1)!p1x1(p2++pk)nx1 確率関数の仮定 i=1kpi=1p2++pk=1p1 より、 f(xi)=n!x1!(nx1)!p1x1(1p1)nx1=nCx1p1x1(1p1)nx1 これは、二項分布 X1B(n,p1) の確率関数の定義式である。

(ii)Xi+Xj(ij) の分布
(i)と同様に考えると、例えば、X1+X2 について、 f(xi)=n!(x1+x2)!(nx1x2)!(p1+p2)x1(1p1p2)nx1x2=nCx1+x2p1x1(1p1p2)nx1 これは、二項分布 X1+X2B(n,p1+p2) の確率関数の定義式である。

証明法②:モーメント母関数を用いる方法

証明

(i)Xi の周辺分布
多項分布のモーメント母関数の公式より、 (1)MX(θ)=(p1eθ1+p2eθ2++pkeθk)n モーメント母関数の定義式 MX(θ)=E(eθ1X1+θ2X2++θnXn) より、 E(eθ1X1+θ2X2++θnXn)=(p1eθ1+p2eθ2++pkeθk)n X1 のモーメント母関数の定義式 MX1(θ)=E(eθ1X1) より、 MX1(θ)=E(eθ1X1)=E(eθ1X1+0++0)(1)θi=0, i=2,3,,n を代入すると、 MX1(θ)=(p1eθ1+p2e0++pke0)n=(p1eθ1+p2++pk)n={p1eθ1+(1p1)}n これは、二項分布 B(n,p1) のモーメント母関数である。

(ii)Xi+Xj(ij) の分布
(i)と同様に考えると、例えば、X1+X2 のモーメント母関数は、 MX1+X2(θ)=E[e(x1+x2)θ]=E[e(x1+x2)θ+0++0]={p1eθ+p2eθ+p3e0++pke0}n={(p1+p2)eθ+p3++pk}n={(p1+p2)eθ+1(p1+p2)}n これは、二項分布 B(n,p1+p2) のモーメント母関数である。

証明法③:任意の事象を中心に意味を考える方法

証明

(i)Xi の周辺分布
ある1つの事象 Ai に着目すると、全事象は、Ai が起こるか起こらないか(Aiの余事象 Aic)に大別することができる。

これは、 P(Ai)=piP(Aic)=1pi というベルヌーイ試行であるとみなすことができるので、 Xi の周辺分布は、二項分布 XiB(n,pi) である。

(ii)Xi+Xj(ij) の分布
同様に考えると、ある2つの事象 Ai,Aj に着目し、全事象を AiorAj が起こるか起こらないか(Ai,jの余事象 Ai,jc)に大別する。

2つは排反な事象なので、 P(AiAj)=pi+pjP[(AiAj)C]=1(pi+pj) というベルヌーイ試行となる。 よって、Xi+Xj(ij) の分布は、二項分布 Xi+XjB(n,pi+pj) となる。

【公式】多項分布の共分散

【公式】
多項分布の共分散
Covariance of Multinomial Distribution

Xi,Xj の共分散は、 Cov(Xi,Xj)=npipj で与えられる。

導出

導出

二項分布の期待値と分散の公式より、確率変数 Xi の期待値と分散は、 E(Xi)=npiV(Xi)=npi(1pi) 確率変数 Xj の期待値と分散は、 E(Xj)=npjV(Xj)=npj(1pj) 確率変数 Xi+Xj の期待値と分散は、 E(Xi+Xj)=n(pi+pj)V(Xi+Xj)=n(pi+pj)(1pipj) 確率変数の和の分散の公式 V(X+Y)=V(X)+V(Y)+2Cov(X,Y) より、 n(pi+pj)(1pipj)=npi(1pi)+npj(1pj)+2Cov(Xi,Xj)npi+npjnpi2npjpjnpj2npjpj=npinpi2+npjnpj2+2Cov(Xi,Xj)2Cov(Xi,Xj)=npjpjnpjpj2Cov(Xi,Xj)=2npjpjCov(Xi,Xj)=npipj

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.124-125
  • 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.56-57
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.76-77
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.94-95

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ