統計検定 1級 2013年 統計数理 問5 尤度比検定と適合度検定

公開日: 更新日:

【2023年5月2週】 【B000】数理統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2013年に実施された統計検定1級『統計数理』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕多項分布の尤度関数

多項分布の確率関数は、 \begin{align} f \left(x\right)=\frac{n!}{x_1! \cdots x_m!}p_1^{x_1} \cdots p_m^{x_m} \end{align} したがって、観測値 $\boldsymbol{x}= \left\{x_1,x_2, \cdots ,x_m\right\}$ が観測されたときのパラメータ $\boldsymbol{\theta}= \left\{\theta_1,\theta_2, \cdots ,\theta_m\right\}$ の尤度関数は、 \begin{align} L \left(\boldsymbol{\theta}\right)=\frac{n!}{x_1! \cdots x_m!}\theta_1^{x_1} \cdots \theta_m^{x_m} \end{align} $\blacksquare$

〔2〕検定統計量の漸近分布

(a)帰無仮説の下での各パラメータの最尤推定量は、$\theta_1=\theta_{10}, \cdots ,\theta_m=\theta_{m0}$ なので、このときの尤度は、 \begin{align} L_0 \left(\boldsymbol{\theta}\right)&=L \left(\boldsymbol{\theta}\middle| H_0\right)\\ &=\frac{n!}{x_1! \cdots x_m!}\theta_{10}^{x_1} \cdots \theta_{m0}^{x_m} \end{align} 対立仮説として、 $\theta_1,\theta_2, \cdots ,\theta_m$ のうち、少なくとも1つが、帰無仮説が想定している値と異なる という仮説を考えると、 このときの最尤推定量は、 \begin{align} \theta_1=\frac{x_1}{n}, \cdots ,\theta_m=\frac{x_m}{n} \end{align} 対立仮説の尤度は、 \begin{align} L_1 \left(\boldsymbol{\theta}\right)&=L \left(\boldsymbol{\theta}\middle| H_1\right)\\ &=\frac{n!}{x_1! \cdots x_m!}\theta_1^{x_1} \cdots \theta_m^{x_m}\\ &=\frac{n!}{x_1! \cdots x_m!} \left(\frac{x_1}{n}\right)^{x_1} \cdots \left(\frac{x_m}{n}\right)^{x_m} \end{align} したがって、尤度比は、 \begin{align} \lambda&=\frac{L_0 \left(\theta\right)}{L_1 \left(\theta\right)}\\ &=\frac{\frac{n!}{x_1! \cdots x_m!}\theta_{10}^{x_1} \cdots \theta_{m0}^{x_m}}{\frac{n!}{x_1! \cdots x_m!} \left(\frac{x_1}{n}\right)^{x_1} \cdots \left(\frac{x_m}{n}\right)^{x_m}}\\ &= \left(\frac{n\theta_{10}}{x_1}\right)^{x_1} \cdots \left(\frac{n\theta_{m0}}{x_m}\right)^{x_m}\\ &=\prod_{i=1}^{m} \left(\frac{n\theta_{i0}}{x_i}\right)^{x_i} \end{align} よって、求める検定統計量 $\Lambda=-2\log{\lambda}$ は、 \begin{align} \Lambda=2\sum_{i=1}^{m}{x_i\log{\frac{x_i}{n\theta_{i0}}}} \end{align} 帰無仮説の下で自由に値を取れるパラメータは $q=0$ 個
対立仮説の下で自由に値を取れるパラメータは $r=m-1$ 個
よって、検定統計量の自由度は、 \begin{align} r-q=m-1-0=m-1 \end{align} したがって、帰無仮説の下で、$\Lambda$ は、漸近的に \begin{align} \Lambda \sim \chi^2 \left(m-1\right) \end{align} $\blacksquare$ (b)帰無仮説の下での各カテゴリーの期待度数は、 \begin{align} E \left(X_i\right)=n\theta_{i0} \end{align} 適合度検定の検定統計量の定義より、 \begin{align} \chi^2=\sum_{i=1}^{m}\frac{ \left(n\theta_{i0}-x_i\right)^2}{n\theta_{i0}} \end{align} 帰無仮説の下で未知のパラメータ数は0 個なので、自由度は、 \begin{align} m-1-0=m-1 \end{align} したがって、 \begin{align} \chi^2 \sim \chi^2 \left(m-1\right) \end{align} $\blacksquare$

〔3〕二項分布の正規近似による検定と適合度検定

(I)二項分布の正規近似による検定
(i)対立仮説における分布
二項分布のパラメータの最尤推定量は、 \begin{align} \hat{p}=\frac{x}{n} \end{align} 二項分布の期待値と分散は、 \begin{align} E \left(X\right)=np \quad V \left(X\right)=np \left(1-p\right) \end{align} 二項分布の正規近似(中心極限定理)により、 \begin{align} X \sim \mathrm{N} \left\{np,np \left(1-p\right)\right\} \end{align} 線形変換の性質より、標本比率 $\hat{p}$ について、 \begin{align} \hat{p} \sim \mathrm{N} \left\{p,\frac{p \left(1-p\right)}{n}\right\} \end{align} (ii)帰無仮説における分布
帰無仮説 $H_0:p=p_0$ における標本比率の分布は、 \begin{align} \hat{p} \sim \mathrm{N} \left\{p_0,\frac{p_0 \left(1-p_0\right)}{n}\right\} \end{align} 帰無仮説において、標本比率 $\hat{p}$ を標準化した値を \begin{align} Z_0=\frac{\sqrt n \left(\hat{p}-p_0\right)}{\sqrt{p_0 \left(1-p_0\right)}} \end{align} とすると、 標準化変換の性質より、 \begin{align} Z_0 \sim N \left(0,1\right) \end{align} $\chi^2$分布の定義より、 \begin{align} \chi^2=\frac{n \left(\hat{p}-p_0\right)^2}{p_0 \left(1-p_0\right)} \sim \chi^2 \left(1\right)\tag1 \end{align}

(II)適合度検定統計量
〔2〕(b)において、$m=2$ のとき、帰無仮説の下で、 \begin{gather} X_1=X\\ X_2=n-X\\ \theta_1=p_0\\ \theta_2=1-p_0 \end{gather} 検定統計量を求めると、 \begin{align} \chi^2&=\frac{ \left(np_0-X\right)^2}{np_0}+\frac{ \left\{n \left(1-p_0\right)- \left(n-X\right)\right\}^2}{n \left(1-p_0\right)}\\ &=\frac{ \left(X-np_0\right)^2}{np_0 \left(1-p_0\right)}\\ &=\frac{n \left(\frac{X}{n}-p_0\right)^2}{p_0 \left(1-p_0\right)}\\ &=\frac{n \left(\hat{p}-p_0\right)^2}{p_0 \left(1-p_0\right)} \sim \chi^2 \left(1\right)\tag2 \end{align} したがって、式 $(1),(2)$ より、二項分布の正規近似による検定と $m=2$ のときの適合度検定は実質的に等しい検定方法である。 $\blacksquare$

〔4〕尤度比検定と適合度検定が漸近的に等しいことの証明

尤度比検定統計量を変形すると、 \begin{align} \Lambda&=2\sum_{i=1}^{m}{x_i\log{\frac{x_i}{n\theta_{i0}}}}\\ &=2\sum_{i=1}^{m}{ \left(x_i-n\theta_{i0}+n\theta_{i0}\right)\log{\frac{x_i-n\theta_{i0}+n\theta_{i0}}{n\theta_{i0}}}}\\ &=2\sum_{i=1}^{m}{ \left(x_i-n\theta_{i0}+n\theta_{i0}\right)\log{ \left(1+\frac{x_i-n\theta_{i0}}{n\theta_{i0}}\right)}} \end{align} ここで、$\log{ \left(1+x\right)}$ を2次の項まででマクローリン展開すると、 \begin{align} \log{ \left(1+x\right)}\cong x-\frac{1}{2}x^2 \end{align} したがって、尤度比検定統計量は近似的に、 \begin{align} \Lambda&\cong2\sum_{i=1}^{m} \left(x_i-n\theta_{i0}+n\theta_{i0}\right) \left\{\frac{x_i-n\theta_{i0}}{n\theta_{i0}}-\frac{1}{2} \left(\frac{x_i-n\theta_{i0}}{n\theta_{i0}}\right)^2\right\}\\ &\cong2\sum_{i=1}^{m}{ \left\{\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}-\frac{1}{2}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}\right\}+ \left\{ \left(x_i-n\theta_{i0}\right)-\frac{1}{2}\frac{ \left(x_i-n\theta_{i0}\right)^3}{n\theta_{i0}}\right\}}\\ &\cong\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}+\sum_{i=1}^{m} \left\{-\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}+2 \left(x_i-n\theta_{i0}\right)\right\}\tag{3} \end{align} ここで、多項分布の仮定より、 \begin{align} \sum_{i=1}^{m} \left(x_i-n\theta_{i0}\right)&=\sum_{i=1}^{m}x_i-n\sum_{i=1}^{m}\theta_{i0}\\ &=n-n \cdot 1\\ &=0 \end{align} また、 \begin{align} \sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}=\sum_{i=1}^{m} \left\{\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}} \cdot \frac{{\hat{\theta}}_i-\theta_{i0}}{\theta_{i0}}\right\} \end{align} 帰無仮説 $H_0:\theta_1=\theta_{10}, \cdots ,\theta_m=\theta_{m0}$ の下で、最尤推定量が一致推定量であることから、 \begin{align} \lim_{n\rightarrow\infty}{ \left|\frac{{\hat{\theta}}_i-\theta_{i0}}{\theta_{i0}}\right|}=0 \end{align} したがって、 \begin{gather} \lim_{n\rightarrow\infty}{\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}}=0 \end{gather} よって、式 $(3)$ より、 \begin{align} \Lambda\cong\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}=\chi^2 \end{align} したがって、〔2〕における(a)および(b)の検定法は、漸近的に同等の検定方法である。 $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ