統計検定 1級 2013年統計数理問3 二項分布の漸近信頼区間-あるノマドの知の旅路～数学・統計学への道

本稿には、2013年に実施された統計検定1級『統計数理』問3の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕二項分布の期待値と分散

（i）期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、 \begin{align} E \left(X\right)=\sum_{x=0}^{n}{x \cdot \frac{n!}{x! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}} \end{align} $x=0$ の項を外に出すと、 \begin{align} E \left(X\right)&=0 \cdot \frac{n!}{0!n!}p^0 \left(1-p\right)^n+\sum_{x=1}^{n}{\frac{n!}{ \left(x-1\right)! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}}\\ &=\sum_{x=1}^{n}{\frac{n!}{ \left(x-1\right)! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}} \end{align} この式を変形すると、 \begin{align} E \left(X\right)&=\sum_{x=1}^{n}{\frac{n \left(n-1\right)!}{ \left(x-1\right)! \left(n-x\right)!} \cdot p \cdot p^{x-1} \left(1-p\right)^{n-x}}\\ &=np\sum_{x=1}^{n}{\frac{ \left(n-1\right)!}{ \left(x-1\right)! \left(n-x\right)!} \cdot p^{x-1} \left(1-p\right)^{n-x}}\\ &=np\sum_{x=1}^{n}{\frac{ \left(n-1\right)!}{ \left(x-1\right)! \left\{ \left(n-1\right)- \left(x-1\right)\right\}!} \cdot p^{x-1} \left(1-p\right)^{ \left(n-1\right)- \left(x-1\right)}}\tag{1} \end{align} ここで、$ \left\{\begin{matrix}y=x-1\\m=n-1\\\end{matrix}\right.$ と変数変換すると、 \begin{align} x:1\rightarrow n \quad \Rightarrow \quad y:0\rightarrow m \end{align}

となるので、

式 $(1)$ は、 \begin{align} E \left(X\right)&=np\sum_{y=0}^{m}{\frac{m!}{y! \left(m-y\right)!}p^y \left(1-p\right)^{m-y}}\\ &=np\sum_{y=0}^{m}{{}_{m}C_yp^y \left(1-p\right)^{m-y}} \end{align} 二項定理 $ \left(a+b\right)^n=\sum_{x=0}^{n}{{}_{n}C_xa^xb^{n-x}}$ において、$a=p,b=1-p$ とすると、 \begin{align} \sum_{y=0}^{m}{{}_{m}C_yp^y \left(1-p\right)^{m-y}}= \left\{p+ \left(1-p\right)\right\}^m=1 \end{align} したがって、 \begin{align} E \left(X\right)=np \end{align} $\blacksquare$

（ii）分散
2次階乗モーメントの定義式 $E \left\{X \left(X-1\right)\right\}=\sum_{x=0}^{\infty}{x \left(x-1\right) \cdot f \left(x\right)}$ より、 \begin{align} E \left\{X \left(X-1\right)\right\}=\sum_{x=0}^{n}{x \left(x-1\right)\frac{n!}{x! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}} \end{align} $x=0,x=1$ の項を外に出すと、 \begin{align} E \left\{X \left(X-1\right)\right\}&=0+0+\sum_{x=2}^{n}{\frac{n!}{ \left(x-2\right)! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}}\\ &=\sum_{x=2}^{n}{\frac{n!}{ \left(x-2\right)! \left(n-x\right)!}p^x \left(1-p\right)^{n-x}}\\ \end{align} この式を変形すると、 \begin{align} E \left\{X \left(X-1\right)\right\}&=\sum_{x=2}^{n}{\frac{n \left(n-1\right) \left(n-2\right)!}{ \left(x-2\right)! \left(n-x\right)!}p^2 \cdot p^{x-2} \left(1-p\right)^{n-x}}\\ &=n \left(n-1\right)p^2\sum_{x=2}^{n}{\frac{ \left(n-2\right)!}{ \left(x-2\right)! \left(n-x\right)!} \cdot p^{x-2} \left(1-p\right)^{n-x}}\\ &=n \left(n-1\right)p^2\sum_{x=2}^{n}{\frac{ \left(n-2\right)!}{ \left(x-2\right)! \left\{ \left(n-2\right)- \left(x-2\right)\right\}!} \cdot p^{x-2} \left(1-p\right)^{ \left(n-2\right)- \left(x-2\right)}}\tag2 \end{align} ここで、$ \left\{\begin{matrix}z=x-2\\l=n-2\\\end{matrix}\right.$ と変数変換すると、 \begin{align} x:2\rightarrow n \quad \Rightarrow \quad z:0\rightarrow l \end{align}

となるので、

式 $(2)$ は、 \begin{align} E \left\{X \left(X-1\right)\right\}&=n \left(n-1\right)p^2\sum_{z=0}^{l}{\frac{l!}{z! \left(l-z\right)!} \cdot p^z \left(1-p\right)^{l-z}}\\ &=n \left(n-1\right)p^2\sum_{z=0}^{l}{{}_{l}C_zp^z \left(1-p\right)^{l-z}} \end{align} 二項定理 $ \left(a+b\right)^n=\sum_{x=0}^{n}{{}_{n}C_xa^xb^{n-x}}$ において、$a=p,b=1-p$ とすると、 \begin{align} \sum_{z=0}^{l}{{}_{l}C_zp^z \left(1-p\right)^{l-z}}= \left\{p+ \left(1-p\right)\right\}^l=1 \end{align} したがって、 \begin{align} E \left\{X \left(X-1\right)\right\}&=n \left(n-1\right)p^2\\ &=n^2p^2-np^2 \end{align} 分散の公式 $V \left(X\right)=E \left\{X \left(X-1\right)\right\}+E \left(X\right)- \left\{E \left(X\right)\right\}^2$ より、 \begin{align} V \left(X\right)&=n^2p^2-np^2+np-n^2p^2\\ &=np-np^2\\ &=np \left(1-p\right) \end{align} $\blacksquare$

〔2〕二項分布の最尤推定量

尤度関数 $L \left(\theta\right)$ を求めると、 \begin{align} L \left(p\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \end{align} 対数尤度関数 $l \left(\theta\right)=\log{L \left(\theta\right)}$ を求めると、 \begin{align} l \left(p\right)&=\log{ \left\{{}_{n}C_xp^x \left(1-p\right)^{n-x}\right\}}\\ &=x\log{p}+ \left(n-x\right)\log{ \left(1-p\right)}+\log{{}_{n}C_x} \end{align} スコア関数 $S \left(\theta\right)=\frac{d}{d\theta}\log{L \left(\theta\right)}$ を求めると、 \begin{align} S \left(p\right)=\frac{x}{p}+\frac{n-x}{1-p} \end{align} 尤度方程式 $S \left(\theta\right)=0$ を解くと、 \begin{gather} 0=\frac{1}{\hat{p}}x+\frac{n-x}{1-\hat{p}}\\ \left(1-\hat{p}\right)x+ \left(n-x\right)\hat{p}=0\\ x-\hat{p}x+n\hat{p}-\hat{p}x=0\\ n\hat{p}=x\\ \hat{p}=\frac{x}{n} \end{gather} $\hat{p}$ の期待値を取ると、 \begin{align} E \left(\hat{p}\right)&=E \left(\frac{x}{n}\right)\\ &=\frac{1}{n}E \left(X\right)\\ &=\frac{1}{n} \cdot np\\ &=p \end{align} したがって、$\hat{p}$ は $p$ の不偏推定量である。 $\blacksquare$

〔3〕最尤推定量の分散

分散の性質 $V \left(aX\right)=a^2V \left(X\right)$ より、 \begin{align} w_n \left(p\right)&=V \left(\hat{p}\right)\\ &=V \left(\frac{x}{n}\right)\\ &=\frac{1}{n^2}V \left(X\right)\\ &=\frac{np \left(1-p\right)}{n^2}\\ &=\frac{p \left(1-p\right)}{n} \end{align} いっぽう、この分散 $w_n \left(p\right)$ の推定量 ${\hat{w}}_n \left(p\right)=w_n \left(\hat{p}\right)$ を求めると、 \begin{align} w_n \left(\hat{p}\right)&=\frac{\hat{p} \left(1-\hat{p}\right)}{n}\\ &=\frac{1}{n} \cdot \frac{x}{n} \left(1-\frac{x}{n}\right)\\ &=\frac{nx-x^2}{n^3}\tag3 \end{align} ここで、分散の公式の変形 $E \left(X^2\right)=E \left\{X \left(X-1\right)\right\}+E \left(X\right)$ より、 \begin{align} E \left(X^2\right)&=n \left(n-1\right)p^2+np\\ &=n^2p^2-np^2+np \end{align} 式 $(3)$ の両辺の期待値を取ると、 \begin{align} E \left\{w_n \left(\hat{p}\right)\right\}&=E \left(\frac{nx-x^2}{n^3}\right)\\ &=\frac{1}{n^3} \left\{nE \left(X\right)-E \left(X^2\right)\right\}\\ &=\frac{1}{n^3} \left\{n^2p- \left(n^2p^2-np^2+np\right)\right\}\\ &=\frac{1}{n^3} \left(n^2p-n^2p^2+np^2-np\right)\\ &=\frac{1}{n^3} \cdot np \left(n-np+p-1\right)\\ &=\frac{p \left\{n \left(1-p\right)- \left(1-p\right)\right\}}{n^2}\\ &=\frac{p \left(1-p\right) \left(n-1\right)}{n^2}\\ &=\frac{n-1}{n} \cdot \frac{p \left(1-p\right)}{n}\\ &=\frac{n-1}{n}w_n \left(p\right) \end{align} したがって、${\hat{w}}_n \left(p\right)$ は、$w_n \left(p\right)$ の不偏推定量ではない。

${\widetilde{w}}_n=c \left(n\right){\hat{w}}_n$ が $w_n \left(p\right)$ の不偏推定量となるとき、 \begin{gather} E \left({\widetilde{w}}_n\right)=w_n \left(p\right)\\ c \left(n\right)E \left\{w_n \left(\hat{p}\right)\right\}=w_n \left(p\right)\\ c \left(n\right)\frac{n-1}{n}w_n \left(p\right)=w_n \left(p\right)\\ c \left(n\right)=\frac{n}{n-1} \end{gather} $\blacksquare$

〔4〕信頼区間の被覆確率

〔3〕で求めた不偏推定量 ${\widetilde{w}}_n$ を用いた信頼区間は、 \begin{align} \hat{p}\pm1.96\sqrt{{\widetilde{w}}_n}&=\hat{p}\pm1.96\sqrt{\frac{n}{n-1}{\hat{w}}_n}\\ &=\hat{p}\pm\sqrt{\frac{n}{n-1}}1.96\sqrt{{\hat{w}}_n}\\ & \geq \hat{p}\pm1.96\sqrt{{\hat{w}}_n} \end{align} したがって、〔3〕で求めた不偏推定量を用いた信頼区間の方が、範囲が広くなっており、被覆確率は高くなる。ただし、サンプル数 $n$ が大きくなり、 \begin{align} \frac{n}{n-1}\cong1 \end{align} が成り立つときには、差がなくなる。 $\blacksquare$

統計検定 1級 2013年統計数理問3 二項分布の漸近信頼区間

〔1〕二項分布の期待値と分散

〔2〕二項分布の最尤推定量

〔3〕最尤推定量の分散

〔4〕信頼区間の被覆確率

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログアーカイブ

ラベル

不正行為を報告

よく読まれている記事

統計検定 1級 2013年 統計数理 問3 二項分布の漸近信頼区間

〔1〕二項分布の期待値と分散

〔2〕二項分布の最尤推定量

〔3〕最尤推定量の分散

〔4〕信頼区間の被覆確率

関連記事

0 件のコメント:

コメントを投稿

自己紹介

このブログを検索

ブログ アーカイブ

ラベル

不正行為を報告

よく読まれている記事

統計検定 1級 2013年統計数理問3 二項分布の漸近信頼区間

ブログアーカイブ