本稿には、2013年に実施された統計検定1級『統計数理』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕多項分布の尤度関数
多項分布の確率関数は、 \begin{align} f \left(x\right)=\frac{n!}{x_1! \cdots x_m!}p_1^{x_1} \cdots p_m^{x_m} \end{align} したがって、観測値 $\boldsymbol{x}= \left\{x_1,x_2, \cdots ,x_m\right\}$ が観測されたときのパラメータ $\boldsymbol{\theta}= \left\{\theta_1,\theta_2, \cdots ,\theta_m\right\}$ の尤度関数は、 \begin{align} L \left(\boldsymbol{\theta}\right)=\frac{n!}{x_1! \cdots x_m!}\theta_1^{x_1} \cdots \theta_m^{x_m} \end{align} $\blacksquare$
〔2〕検定統計量の漸近分布
(a)帰無仮説の下での各パラメータの最尤推定量は、$\theta_1=\theta_{10}, \cdots ,\theta_m=\theta_{m0}$ なので、このときの尤度は、
\begin{align}
L_0 \left(\boldsymbol{\theta}\right)&=L \left(\boldsymbol{\theta}\middle| H_0\right)\\
&=\frac{n!}{x_1! \cdots x_m!}\theta_{10}^{x_1} \cdots \theta_{m0}^{x_m}
\end{align}
対立仮説として、
$\theta_1,\theta_2, \cdots ,\theta_m$ のうち、少なくとも1つが、帰無仮説が想定している値と異なる
という仮説を考えると、
このときの最尤推定量は、
\begin{align}
\theta_1=\frac{x_1}{n}, \cdots ,\theta_m=\frac{x_m}{n}
\end{align}
対立仮説の尤度は、
\begin{align}
L_1 \left(\boldsymbol{\theta}\right)&=L \left(\boldsymbol{\theta}\middle| H_1\right)\\
&=\frac{n!}{x_1! \cdots x_m!}\theta_1^{x_1} \cdots \theta_m^{x_m}\\
&=\frac{n!}{x_1! \cdots x_m!} \left(\frac{x_1}{n}\right)^{x_1} \cdots \left(\frac{x_m}{n}\right)^{x_m}
\end{align}
したがって、尤度比は、
\begin{align}
\lambda&=\frac{L_0 \left(\theta\right)}{L_1 \left(\theta\right)}\\
&=\frac{\frac{n!}{x_1! \cdots x_m!}\theta_{10}^{x_1} \cdots \theta_{m0}^{x_m}}{\frac{n!}{x_1! \cdots x_m!} \left(\frac{x_1}{n}\right)^{x_1} \cdots \left(\frac{x_m}{n}\right)^{x_m}}\\
&= \left(\frac{n\theta_{10}}{x_1}\right)^{x_1} \cdots \left(\frac{n\theta_{m0}}{x_m}\right)^{x_m}\\
&=\prod_{i=1}^{m} \left(\frac{n\theta_{i0}}{x_i}\right)^{x_i}
\end{align}
よって、求める検定統計量 $\Lambda=-2\log{\lambda}$ は、
\begin{align}
\Lambda=2\sum_{i=1}^{m}{x_i\log{\frac{x_i}{n\theta_{i0}}}}
\end{align}
帰無仮説の下で自由に値を取れるパラメータは $q=0$ 個
対立仮説の下で自由に値を取れるパラメータは $r=m-1$ 個
よって、検定統計量の自由度は、
\begin{align}
r-q=m-1-0=m-1
\end{align}
したがって、帰無仮説の下で、$\Lambda$ は、漸近的に
\begin{align}
\Lambda \sim \chi^2 \left(m-1\right)
\end{align}
$\blacksquare$
(b)帰無仮説の下での各カテゴリーの期待度数は、
\begin{align}
E \left(X_i\right)=n\theta_{i0}
\end{align}
適合度検定の検定統計量の定義より、
\begin{align}
\chi^2=\sum_{i=1}^{m}\frac{ \left(n\theta_{i0}-x_i\right)^2}{n\theta_{i0}}
\end{align}
帰無仮説の下で未知のパラメータ数は0 個なので、自由度は、
\begin{align}
m-1-0=m-1
\end{align}
したがって、
\begin{align}
\chi^2 \sim \chi^2 \left(m-1\right)
\end{align}
$\blacksquare$
〔3〕二項分布の正規近似による検定と適合度検定
(I)二項分布の正規近似による検定
(i)対立仮説における分布
二項分布のパラメータの最尤推定量は、
\begin{align}
\hat{p}=\frac{x}{n}
\end{align}
二項分布の期待値と分散は、
\begin{align}
E \left(X\right)=np \quad V \left(X\right)=np \left(1-p\right)
\end{align}
二項分布の正規近似(中心極限定理)により、
\begin{align}
X \sim \mathrm{N} \left\{np,np \left(1-p\right)\right\}
\end{align}
線形変換の性質より、標本比率 $\hat{p}$ について、
\begin{align}
\hat{p} \sim \mathrm{N} \left\{p,\frac{p \left(1-p\right)}{n}\right\}
\end{align}
(ii)帰無仮説における分布
帰無仮説 $H_0:p=p_0$ における標本比率の分布は、
\begin{align}
\hat{p} \sim \mathrm{N} \left\{p_0,\frac{p_0 \left(1-p_0\right)}{n}\right\}
\end{align}
帰無仮説において、標本比率 $\hat{p}$ を標準化した値を
\begin{align}
Z_0=\frac{\sqrt n \left(\hat{p}-p_0\right)}{\sqrt{p_0 \left(1-p_0\right)}}
\end{align}
とすると、
標準化変換の性質より、
\begin{align}
Z_0 \sim N \left(0,1\right)
\end{align}
$\chi^2$分布の定義より、
\begin{align}
\chi^2=\frac{n \left(\hat{p}-p_0\right)^2}{p_0 \left(1-p_0\right)} \sim \chi^2 \left(1\right)\tag1
\end{align}
(II)適合度検定統計量
〔2〕(b)において、$m=2$ のとき、帰無仮説の下で、
\begin{gather}
X_1=X\\
X_2=n-X\\
\theta_1=p_0\\
\theta_2=1-p_0
\end{gather}
検定統計量を求めると、
\begin{align}
\chi^2&=\frac{ \left(np_0-X\right)^2}{np_0}+\frac{ \left\{n \left(1-p_0\right)- \left(n-X\right)\right\}^2}{n \left(1-p_0\right)}\\
&=\frac{ \left(X-np_0\right)^2}{np_0 \left(1-p_0\right)}\\
&=\frac{n \left(\frac{X}{n}-p_0\right)^2}{p_0 \left(1-p_0\right)}\\
&=\frac{n \left(\hat{p}-p_0\right)^2}{p_0 \left(1-p_0\right)} \sim \chi^2 \left(1\right)\tag2
\end{align}
したがって、式 $(1),(2)$ より、二項分布の正規近似による検定と $m=2$ のときの適合度検定は実質的に等しい検定方法である。
$\blacksquare$
〔4〕尤度比検定と適合度検定が漸近的に等しいことの証明
尤度比検定統計量を変形すると、 \begin{align} \Lambda&=2\sum_{i=1}^{m}{x_i\log{\frac{x_i}{n\theta_{i0}}}}\\ &=2\sum_{i=1}^{m}{ \left(x_i-n\theta_{i0}+n\theta_{i0}\right)\log{\frac{x_i-n\theta_{i0}+n\theta_{i0}}{n\theta_{i0}}}}\\ &=2\sum_{i=1}^{m}{ \left(x_i-n\theta_{i0}+n\theta_{i0}\right)\log{ \left(1+\frac{x_i-n\theta_{i0}}{n\theta_{i0}}\right)}} \end{align} ここで、$\log{ \left(1+x\right)}$ を2次の項まででマクローリン展開すると、 \begin{align} \log{ \left(1+x\right)}\cong x-\frac{1}{2}x^2 \end{align} したがって、尤度比検定統計量は近似的に、 \begin{align} \Lambda&\cong2\sum_{i=1}^{m} \left(x_i-n\theta_{i0}+n\theta_{i0}\right) \left\{\frac{x_i-n\theta_{i0}}{n\theta_{i0}}-\frac{1}{2} \left(\frac{x_i-n\theta_{i0}}{n\theta_{i0}}\right)^2\right\}\\ &\cong2\sum_{i=1}^{m}{ \left\{\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}-\frac{1}{2}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}\right\}+ \left\{ \left(x_i-n\theta_{i0}\right)-\frac{1}{2}\frac{ \left(x_i-n\theta_{i0}\right)^3}{n\theta_{i0}}\right\}}\\ &\cong\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}+\sum_{i=1}^{m} \left\{-\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}+2 \left(x_i-n\theta_{i0}\right)\right\}\tag{3} \end{align} ここで、多項分布の仮定より、 \begin{align} \sum_{i=1}^{m} \left(x_i-n\theta_{i0}\right)&=\sum_{i=1}^{m}x_i-n\sum_{i=1}^{m}\theta_{i0}\\ &=n-n \cdot 1\\ &=0 \end{align} また、 \begin{align} \sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}=\sum_{i=1}^{m} \left\{\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}} \cdot \frac{{\hat{\theta}}_i-\theta_{i0}}{\theta_{i0}}\right\} \end{align} 帰無仮説 $H_0:\theta_1=\theta_{10}, \cdots ,\theta_m=\theta_{m0}$ の下で、最尤推定量が一致推定量であることから、 \begin{align} \lim_{n\rightarrow\infty}{ \left|\frac{{\hat{\theta}}_i-\theta_{i0}}{\theta_{i0}}\right|}=0 \end{align} したがって、 \begin{gather} \lim_{n\rightarrow\infty}{\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^3}{ \left(n\theta_{i0}\right)^2}}=0 \end{gather} よって、式 $(3)$ より、 \begin{align} \Lambda\cong\sum_{i=1}^{m}\frac{ \left(x_i-n\theta_{i0}\right)^2}{n\theta_{i0}}=\chi^2 \end{align} したがって、〔2〕における(a)および(b)の検定法は、漸近的に同等の検定方法である。 $\blacksquare$
0 件のコメント:
コメントを投稿