指数型分布族

公開日:

【2023年4月3週】 【B000】数理統計学 【B070】統計的推定

この記事をシェアする
  • B!
サムネイル画像

本稿では、指数型分布族の定義を紹介し、ベルヌーイ分布、二項分布、ポアソン分布、幾何分布、多項分布、負の二項分布、正規分布、指数分布、ガンマ分布、ベータ分布、カイ2乗分布が指数型分布族であることを証明しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

指数型分布族

(i)パラメータがひとつの場合
1つのパラメータ θ をもつ分布の確率(密度)関数が f(x;θ)=h(x)exp{c(θ)T(x)+d(θ)} または f(x;θ)=exp{c(θ)T(x)+d(θ)+h(x)} ただし、 c(θ),d(θ) は、Θ 上の実関数、T(x),h(x) は、R 上の実関数 のかたちで表すことができるとき、 その分布は、 1パラメータの指数型分布族 exponential family という。

(ii)パラメータが複数の場合
また、k 個のパラメータ θ={θ1,θ2,,θk} をもつ分布の確率(密度)関数が f(x;θ)=h(x)exp{i=1kci(θ)Ti(x)+d(θ)} または f(x;θ)=exp{i=1kci(θ)Ti(x)+d(θ)+h(x)} のかたちで表すことができるとき、 その分布は、 k パラメータの指数型分布族 という。 また、
(1)x がパラメータに依存しない
(2)c(θ) は、各 θi の連続関数
(3)確率密度関数の場合、h(x) と導関数 Ti(x) は0でない x の連続関数 という条件を満足させるものを 正則な指数型分布族 という。

証明:ベルヌーイ分布

証明

ベルヌーイ分布 Ber(p) の確率関数は、 f(x)={px(1p)1xx=0,10other 確率関数をネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{logpx(1p)1x}=exp{xlogp+(1x)log(1p)}=exp{xlogp+log(1p)xlog(1p)}=exp[{logplog(1p)}x+log(1p)] θ=p とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=logplog(1p)T(x)=xd(θ)=log(1p)h(x)=0 この分布は1パラメータの指数型分布族に属すると言える。

証明:二項分布

証明

二項分布 B(n,p) の確率関数は、 f(x)={nCxpx(1p)nxx=0,1,,n0other 確率関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{lognCxpx(1p)nx}=exp{xlogp+(nx)log(1p)+lognCx}=exp{xlogpxlog(1p)+nlog(1p)+lognCx}=exp[{logplog(1p)}x+nlog(1p)+lognCx]

(i)n が既知で、p が未知のとき
θ=p とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=logplog(1p)T(x)=xd(θ)=nlog(1p)h(x)=lognCx この分布は1パラメータの指数型分布族に属する。

(ii)n が未知で、p が既知のとき
θ=p とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=not existT(x)=not existd(θ)=nlog(1p)h(x)=x{logplog(1p)}+lognCx この分布は指数型分布族には属さない。

(iii)np がともに未知のとき
θ=(n,p) とすると、指数型分布族の定義式において、以下のように考えると、 c1(θ)=not existc2(θ)=logplog(1p)T1(x)=not existT2(x)=xd(θ)=nlog(1p)h(x)=lognCx この分布は指数型分布族には属さない。

証明:ポアソン分布

証明

ポアソン分布 Po(λ) の確率関数は、 f(x)={λxeλx!x=0,1,2,0other 確率関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{λ+log(λxx!)}=exp{xlogλλlogx!} θ=λ とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=logλT(x)=xd(θ)=λh(x)=logx! この分布は1パラメータの指数型分布族に属する。

証明:幾何分布

証明

幾何分布 G(p) の確率関数は、 f(x)={(1p)xpx=0,1,2,0other 確率関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp[log{(1p)xp}]=exp{logp+xlog(1p)}=exp{xlog(1p)+logp} θ=p とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=log(1p)T(x)=xd(θ)=logph(x)=0 この分布は1パラメータの指数型分布族に属する。

証明:多項分布

証明

多項分布 MN(n,p) の同時確率関数は、 f(x)={n!x1!xk!p1x1pkxkxi=0,1,,n0other 同時確率関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{log(n!x1!xn!p1x1pkxk)}=exp{i=1k(xilogpi)+logn!i=1klogxi!}

(i)n が既知で、p が未知のとき
θ=(p1,p2,,pk) とすると、指数型分布族の定義式において、以下のように考えると、 ci(θ)=logpiTi(x)=xid(θ)=not existh(x)=logn!i=1klogxi! この分布は指数型分布族には属さない。

(ii)n が未知で、p が既知のとき
θ=n とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=not existT(x)=not existd(θ)=logn!h(x)=i=1k(xilogpi)i=1klogxi! この分布は指数型分布族には属さない。

(iii)np がともに未知のとき
θ=(n,p1,p2,,pk) とすると、指数型分布族の定義式において、以下のように考えると、 ci(θ)=logpiTi(x)=xid(θ)=logn!h(x)=i=1klogxi! この分布は k パラメータの指数型分布族に属する。

証明:負の二項分布

証明

負の二項分布 NB(n,p) の確率関数は、 f(x)={n+x1Cxpx(1p)nxx=0,1,2,0other 確率関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp[log{n+x1Cx(1p)npx}]=exp{xlogp+nlog(1p)+logn+x1Cx}=exp{xlogp+nlog(1p)+logx!(x+n1)!(n1)!}=exp{xlogp+nlog(1p)+logx!log(n1)!log(x+n1)!}

(i)n が既知で、p が未知のとき
θ=p とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=logpT(x)=xd(θ)=nlog(1p)log(n1)!h(x)=logx!log(x+n1)! この分布は1パラメータの指数型分布族に属する。

(ii)n が未知で、p が既知のとき
θ=n とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=not existT(x)=not existd(θ)=nlog(1p)log(n1)!h(x)=xlogp+logx! したがって、この分布は指数型分布族には属さない。

(iii)np がともに未知のとき
θ=(n,p) とすると、指数型分布族の定義式において、以下のように考えると、 c1(θ)=not existT1(x)=not existc2(θ)=logplog(1p)T2(x)=xd(θ)=nlog(1p)log(n1)!h(x)=logx! この分布は指数型分布族には属さない。

証明:正規分布

証明

正規分布 N(μ,σ2) の確率密度関数は、 f(x)=12πσe(xμ)22σ2<x<<μ<0<σ 確率密度関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{(xμ)22σ2log2πσ2}=exp{x22σ2+μxσ2μ22σ212(log2π+logσ2)}=exp{x22σ2+μxσ2μ22σ212log2π12logσ2}

(i)μ が既知で、σ2 が未知のとき
θ=σ2 とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=12σ2T(x)=(xμ)2d(θ)=12logσ2h(x)=12log2π この分布は1パラメータの指数型分布族に属する。

(ii)μ が未知で、σ2 が既知のとき
θ=μ とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=μσ2T(x)=xd(θ)=μ22σ2h(x)=x22σ212log2π12logσ2 この分布は1パラメータの指数型分布族に属する。

(iii)μσ2 がともに未知のとき
θ=(μ,σ2) とすると、指数型分布族の定義式において、以下のように考えると、 c1(θ)=μσ2T1(x)=xc2(θ)=12σ2T2(x)=x2d(θ)=μ22σ212logσ2h(x)=12log2π この分布は2パラメータの指数型分布族に属する。

証明:指数分布

証明

指数分布 Ex(λ) の確率密度関数は、 f(x)={λeλx0x0other 確率密度関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp(λx+logλ) θ=λ とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=λT(x)=xd(θ)=logλh(x)=0 この分布は1パラメータの指数型分布族に属する。

証明:ガンマ分布

証明

ガンマ分布 Ga(α,β) の確率密度関数は、 f(x)={βαΓ(α)xα1eβx0x0other 確率密度関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{βxlog(βαΓ(α)xα1)}=exp{βx{αlogβlogΓ(α)+(α1)logx}}=exp{αlogxβxαlogβ+logΓ(α)+logx}

(i)α が既知で、β が未知のとき
θ=β とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=βT(x)=xd(θ)=αlogβ+logΓ(α)h(x)=(α1)logx この分布は1パラメータの指数型分布族に属する。

(ii)α が未知で、β が既知のとき
θ=α とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=αT(x)=logxd(θ)=αlogβ+logΓ(α)h(x)=βx+logx この分布は1パラメータの指数型分布族に属する。

(iii)αβ がともに未知のとき
θ=(α,β) とすると、指数型分布族の定義式において、以下のように考えると、 c1(θ)=αT1(x)=logxc2(θ)=βT2(x)=xd(θ)=αlogβ+logΓ(α)h(x)=logx この分布は2パラメータの指数型分布族に属する。

証明:ベータ分布

証明

ベータ分布 Be(α,β) の確率密度関数は、 f(x)={1B(α,β)xα1(1x)β10<x<10other 確率密度関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp{log(xα1(1x)β1B(α,β))}=exp{(α1)logx+(β1)log(1x)logB(α,β)}=exp{αlogxlogx+βlog(1x)log(1x)logB(α,β)}=exp{αlogx+βlog(1x)logB(α,β)logxlog(1x)}

(i)α が既知で、β が未知のとき
θ=β とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=βT(x)=log(1x)d(θ)=logB(α,β)h(x)=αlogxlogxlog(1x) この分布は1パラメータの指数型分布族に属する。

(ii)α が未知で、β が既知のとき
θ=α とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=αT(x)=logxd(θ)=logB(α,β)h(x)=βlog(1x)logxlog(1x) この分布は1パラメータの指数型分布族に属する。

(iii)αβ がともに未知のとき
θ=(α,β) とすると、指数型分布族の定義式において、以下のように考えると、 c1(θ)=αT1(x)=logxc2(θ)=βT2(x)=log(1x)d(θ)=logB(α,β)h(x)=logxlog(1x) この分布は2パラメータの指数型分布族に属する。

証明:カイ2乗分布

証明

χ2分布 χ2(n) の確率密度関数は、 f(x)={12n2Γ(n2)xn21ex20x0other 確率密度関数を、ネイピアの数を底とする指数関数のかたちで表すと、 f(x;θ)=exp[x2+log{12n2Γ(n2)xn21}]=exp{x2+(n21)logxlogΓ(n2)n2log2}=exp{n2logxlogΓ(n2)n2log2logxx2} θ=n とすると、指数型分布族の定義式において、以下のように考えると、 c(θ)=n2T(x)=logxd(θ)=logΓ(n2)n2log2h(x)=logxx2 この分布は1パラメータの指数型分布族に属する。

【定理】指数型分布族の十分統計量

【定理】
指数型分布族の十分統計量
Sufficient Statistic of Exponential Family

確率変数 X が任意の k パラメータの指数型分布族に従い、その分布からの大きさ n の無作為標本を X={X1,X2,,Xn} とすると、 同時確率(密度)関数は、 f(x;θ)={i=1nh(xi)}exp{j=1kcj(θ)i=1nTj(xi)+nd(θ)} となり、指数型分布族に属する。 また、フィッシャー・ネイマンの因子分解定理より、 S(X)={i=1nT1(Xi),i=1nT2(Xi),,i=1nTk(Xi)} は、θ に対する十分統計量になる。

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.204-207
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.119

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ