統計検定 1級 2024年 統計数理 問3 二項分布、平均二乗誤差、推定量の比較

公開日: 更新日:

【B000】数理統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2024年に実施された統計検定1級『統計数理』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 統計検定の問題の使用に関する規約により禁止されているため、問題文は掲載することができません。公式サイトで公開されているものなどをご参照ください。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕ベルヌーイ分布の和

ベルヌーイ分布の確率関数は、 f(x)={ θx(1θ)1xx=0,10other 期待値の定義より、 E(X)=x=01xθx(1θ)1x=0θ0(1θ)1+1θ1(1θ)0=θ 同様に、 E(X2)=x=01x2θx(1θ)1x=02θ0(1θ)1+12θ1(1θ)0=θ 分散の公式 V(X)=E(X2){E(X)}2 より、 V(X)=θθ2=θ(1θ) ベルヌーイ分布に従う確率変数の和 Sn が従う分布は、二項分布であり、期待値の性質より、 E(Sn)=E(i=1nXi)=i=1nE(Xi)=nθ 同様に、確率変数 Xi は互いに独立であることから、分散の加法性より、 V(Sn)=V(i=1nXi)=i=1nV(Xi)=nθ(1θ)

〔2〕十分統計量・最尤推定量

二項分布の確率関数は、 g(s)={ nCsθs(1θ)nss=0,1,,n0other 具体的な観測値として、Sn=s という値が得られたときの同時確率関数(尤度関数) L(θ) は、 L(θ)=nCsθs(1θ)ns このとき、 g(t,θ)=θs(1θ)nsT(S)=sh(s)=nCs と考えると、 フィッシャー・ネイマンの因子分解定理により、Sn=s はパラメータ θ を推定するための十分推定量である。

また、対数尤度関数 l(θ)=logL(θ) を求めると、 l(θ)=slogθ+(ns)log(1θ)+lognCs スコア関数 S(θ)=ddθlogL(θ) を求めると、 S(θ)=sθns1θ 尤度方程式 S(θ)=0 を解くと、 0=1θ^MLsns1θ^ML(1θ^ML)s(ns)θ^ML=0sθ^MLsnθ^ML+θ^MLs=0nθ^ML=sθ^ML=sn

〔3〕平均二乗誤差

平均二乗誤差は、 MSE(Tn)=E[(Tnθ)2]=E[{TnE(Tn)+E(Tn)θ}2]=E[{TnE(Tn)}2]2E[{TnE(Tn)}{E(Tn)θ}]+E[{E(Tn)θ}2]=V(Tn)2{E(Tn)θ}{E(Tn)E(Tn)}+{E(Tn)θ}2=V(Tn)+{E(Tn)θ}2 というように、推定量の分散とバイアスに分解することができる。

ここで期待値と分散の性質より、〔1〕の結果を用いると、 E(Tn)=E(αnSn+βn)=αnE(Sn)+βn=αnnθ+βn V(Tn)=V(αnSn+βn)=αn2V(Sn)=αn2nθ(1θ) したがって、 MSE(Tn)=αn2nθ(1θ)+(αnnθ+βnθ)2=αn2nθ(1θ)+{(αnn1)θ+βn}2=nαn2θnαn2θ2+(αnn1)2θ2+2(αnn1)βnθ+βn2={(αnn1)2nαn2}θ2+{nαn2+2(αnn1)βn}θ+βn2={(n2n)αn22αnn+1}θ2+{nαn2+2(αnn1)βn}θ+βn2 これが θ によらず一定であるためには、θ に関する係数について、 (n2n)αn22nαn+1=0nαn2+2(αnn1)βn=0 が必要条件となる。 まず、αn について、二次方程式の解の公式より、 αn=2n±4n24n2+4n2(n2n)=2n±2n2(n2n)=n±nn2n=1n(n±1)

導出過程(クリックで表示) (1)αn=n+nn2n のとき αn=n+nn2n=n(n+1)n(n1)=n(n+1)n(n+1)(n1)=1n(n1) (2)αn=nnn2n のとき αn=nnn2n=n(n1)n(n1)=n(n1)n(n+1)(n1)=1n(n+1)
また、βn について、 βn=nαn22(αnn1)=12(n1), 12(n+1)
導出過程(クリックで表示) (1)αn=1n(n1) のとき βn=nαn22(αnn1)=n2{n1n(n1)1}1n(n1)2=12{n(n1)n1}1(n1)2=12(1n1)1(n1)2=n121(n1)2=12(n1) (2)αn=1n(n+1) のとき βn=nαn22(αnn1)=n2{n1n(n+1)1}1n(n+1)2=12{n(n+1)n+1}1(n+1)2=12(1n+1)1(n+1)2=n+121(n+1)2=12(n+1)
すなわち、αn,βn の組み合わせは、 (αn,βn)=[1n(n1),12(n1)],[1n(n+1),12(n+1)]

このとき、平均二乗誤差は、 MSE(Tn)=βn2=14(n±1)2 このうち小さい方の値は、 (αn,βn)=[1n(n+1),12(n+1)]MSE(Tn)=14(n+1)2

導出過程 n1<n+1(n1)2<(n+1)24(n1)2<4(n+1)214(n+1)2<14(n1)2

〔4〕推定量の比較

最尤推定量の分散は、分散の性質より、 V(θ^ML)=V(Snn)=1n2V(Sn)=nθ(1θ)n2=θ(1θ)n 平均二乗誤差の方が小さくなる θ の範囲は、 14(n+1)2<θ(1θ)nn4(n+1)2<θθ2θ2θ+n4(n+1)2<0 ここで、二次方程式の解の公式より、 θ=12[1±1n(n+1)2]=12(1±n+2n+1nn+1)=12±2n+12(n+1) したがって、求める範囲は、 122n+12(n+1)<θ<12+2n+12(n+1)

例えば、n=1 のとき、この範囲は、 122+12(1+1)<θ<12+2+12(1+1)234<θ<2+34 いっぽう、n のとき、 limn2n+12(n+1)=limn2n+12(n+1)1n1n=limn1n+1n2(1+1n)=021=0 したがって、 12<θ<12 これらから、サンプルサイズが少ないうちは、Tn の方が優れている真値の範囲が広く、Tn の方が良い推定量である可能性が高いが、サンプルサイズが大きくなるにつれて、その範囲が狭まっていき、最尤推定量の方が優れた推定量になってくると評価できる。

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

QooQ