統計検定 1級 2013年 統計数理 問3 二項分布の漸近信頼区間

公開日:

【2023年5月2週】 【B000】数理統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2013年に実施された統計検定1級『統計数理』 問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕二項分布の期待値と分散

(i)期待値
期待値の定義式 E(X)=x=xf(x) より、 E(X)=x=0nxn!x!(nx)!px(1p)nx x=0 の項を外に出すと、 E(X)=0n!0!n!p0(1p)n+x=1nn!(x1)!(nx)!px(1p)nx=x=1nn!(x1)!(nx)!px(1p)nx この式を変形すると、 E(X)=x=1nn(n1)!(x1)!(nx)!ppx1(1p)nx=npx=1n(n1)!(x1)!(nx)!px1(1p)nx(1)=npx=1n(n1)!(x1)!{(n1)(x1)}!px1(1p)(n1)(x1) ここで、{y=x1m=n1 と変数変換すると、 x:1ny:0m

となるので、
(1) は、 E(X)=npy=0mm!y!(my)!py(1p)my=npy=0mmCypy(1p)my 二項定理 (a+b)n=x=0nnCxaxbnx において、a=p,b=1p とすると、 y=0mmCypy(1p)my={p+(1p)}m=1 したがって、 E(X)=np

(ii)分散
2次階乗モーメントの定義式 E{X(X1)}=x=0x(x1)f(x) より、 E{X(X1)}=x=0nx(x1)n!x!(nx)!px(1p)nx x=0,x=1 の項を外に出すと、 E{X(X1)}=0+0+x=2nn!(x2)!(nx)!px(1p)nx=x=2nn!(x2)!(nx)!px(1p)nx この式を変形すると、 E{X(X1)}=x=2nn(n1)(n2)!(x2)!(nx)!p2px2(1p)nx=n(n1)p2x=2n(n2)!(x2)!(nx)!px2(1p)nx(2)=n(n1)p2x=2n(n2)!(x2)!{(n2)(x2)}!px2(1p)(n2)(x2) ここで、{z=x2l=n2 と変数変換すると、 x:2nz:0l

となるので、
(2) は、 E{X(X1)}=n(n1)p2z=0ll!z!(lz)!pz(1p)lz=n(n1)p2z=0llCzpz(1p)lz 二項定理 (a+b)n=x=0nnCxaxbnx において、a=p,b=1p とすると、 z=0llCzpz(1p)lz={p+(1p)}l=1 したがって、 E{X(X1)}=n(n1)p2=n2p2np2 分散の公式 V(X)=E{X(X1)}+E(X){E(X)}2 より、 V(X)=n2p2np2+npn2p2=npnp2=np(1p)

〔2〕二項分布の最尤推定量

尤度関数 L(θ) を求めると、 L(p)=nCxpx(1p)nx 対数尤度関数 l(θ)=logL(θ) を求めると、 l(p)=log{nCxpx(1p)nx}=xlogp+(nx)log(1p)+lognCx スコア関数 S(θ)=ddθlogL(θ) を求めると、 S(p)=xp+nx1p 尤度方程式 S(θ)=0 を解くと、 0=1p^x+nx1p^(1p^)x+(nx)p^=0xp^x+np^p^x=0np^=xp^=xn p^ の期待値を取ると、 E(p^)=E(xn)=1nE(X)=1nnp=p したがって、p^p の不偏推定量である。

〔3〕最尤推定量の分散

分散の性質 V(aX)=a2V(X) より、 wn(p)=V(p^)=V(xn)=1n2V(X)=np(1p)n2=p(1p)n いっぽう、この分散 wn(p) の推定量 w^n(p)=wn(p^) を求めると、 wn(p^)=p^(1p^)n=1nxn(1xn)(3)=nxx2n3 ここで、分散の公式の変形 E(X2)=E{X(X1)}+E(X) より、 E(X2)=n(n1)p2+np=n2p2np2+np(3) の両辺の期待値を取ると、 E{wn(p^)}=E(nxx2n3)=1n3{nE(X)E(X2)}=1n3{n2p(n2p2np2+np)}=1n3(n2pn2p2+np2np)=1n3np(nnp+p1)=p{n(1p)(1p)}n2=p(1p)(n1)n2=n1np(1p)n=n1nwn(p) したがって、w^n(p) は、wn(p) の不偏推定量ではない。

w~n=c(n)w^nwn(p) の不偏推定量となるとき、 E(w~n)=wn(p)c(n)E{wn(p^)}=wn(p)c(n)n1nwn(p)=wn(p)c(n)=nn1

〔4〕信頼区間の被覆確率

〔3〕で求めた不偏推定量 w~n を用いた信頼区間は、 p^±1.96w~n=p^±1.96nn1w^n=p^±nn11.96w^np^±1.96w^n したがって、〔3〕で求めた不偏推定量を用いた信頼区間の方が、範囲が広くなっており、被覆確率は高くなる。ただし、サンプル数 n が大きくなり、 nn11 が成り立つときには、差がなくなる。

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ