本稿には、2024年に実施された統計検定1級『統計数理』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 統計検定の問題の使用に関する規約により禁止されているため、問題文は掲載することができません。公式サイトで公開されているものなどをご参照ください。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕順序統計量の分布
まず、確率変数 $X_j$ の確率密度関数と累積分布関数は、 \begin{gather} F \left(x\right)= \left\{\ \begin{matrix}0&-0.5 \lt x\\x+0.5&-0.5 \le x \le 0.5\\1&x \lt 0.5\\\end{matrix}\right.\\ f \left(x\right)= \left\{\ \begin{matrix}1&-0.5 \le x \le 0.5\\0&\mathrm{other}\\\end{matrix}\right. \end{gather}
順序統計量の確率密度関数の公式 \begin{align} f_i \left(x_i\right)=\frac{n!}{ \left(i-1\right)! \left(n-i\right)!} \cdot \left\{F \left(x\right)\right\}^{i-1} \cdot f \left(x\right) \cdot \left\{1-F \left(x\right)\right\}^{n-i} \end{align} を用いると、 \begin{align} f_1 \left(x_1\right)&=\frac{3!}{ \left(1-1\right)! \left(3-1\right)!} \cdot \left(x_1+0.5\right)^{1-1} \cdot 1 \cdot \left\{1- \left(x_1+0.5\right)\right\}^{3-1}\\ &=\frac{3!}{1 \cdot 2!} \cdot 1 \cdot 1 \cdot \left(0.5-x_1\right)^2\\ &=3 \left(0.5-x_1\right)^2 \end{align} \begin{align} f_2 \left(x_2\right)&=\frac{3!}{ \left(2-1\right)! \left(3-2\right)!} \cdot \left(x_2+0.5\right)^{2-1} \cdot 1 \cdot \left\{1- \left(x_2+0.5\right)\right\}^{3-2}\\ &=\frac{3!}{1 \cdot 1} \cdot \left(x_2+0.5\right) \cdot 1 \cdot \left(0.5-x_2\right)\\ &=6 \left(0.25-x_2^2\right) \end{align} \begin{align} f_3 \left(x_3\right)&=\frac{3!}{ \left(3-1\right)! \left(3-3\right)!} \cdot \left(x_3+0.5\right)^{3-1} \cdot 1 \cdot \left\{1- \left(x_3+0.5\right)\right\}^{3-3}\\ &=\frac{3!}{2! \cdot 1} \cdot \left(x_3+0.5\right)^2 \cdot 1 \cdot 1\\ &=3 \left(x_3+0.5\right)^2 \end{align}
それぞれの期待値は、積分範囲が原点対称であることから、奇関数の積分の性質(積分値が0になる)を用いると、 \begin{align} E \left[X_{ \left(1\right)}\right]&=\int_{-\frac{1}{2}}^{\frac{1}{2}}{x \cdot 3 \left(0.5-x\right)^2dx}\\ &=3\int_{-\frac{1}{2}}^{\frac{1}{2}} \left(x^3-x^2+0.25x\right)dx\\ &=-3\int_{-\frac{1}{2}}^{\frac{1}{2}}{x^2dx}\\ &=-3 \left[\frac{1}{3}x^3\right]_{-\frac{1}{2}}^{\frac{1}{2}}\\ &=- \left(\frac{1}{8}+\frac{1}{8}\right)\\ &=-\frac{1}{4} \end{align} \begin{align} E \left[X_{ \left(2\right)}\right]&=\int_{-\frac{1}{2}}^{\frac{1}{2}}{x \cdot \left(\frac{3}{2}-6x^2\right)dx}\\ &=\int_{-\frac{1}{2}}^{\frac{1}{2}} \left(\frac{3}{2}x-6x^3\right)dx\\ &=0 \end{align} \begin{align} E \left[X_{ \left(3\right)}\right]&=\int_{-\frac{1}{2}}^{\frac{1}{2}}{x \cdot 3 \left(x+0.5\right)^2dx}\\ &=3\int_{-\frac{1}{2}}^{\frac{1}{2}} \left(x^3+x^2+\frac{1}{4}x\right)dx\\ &=3\int_{-\frac{1}{2}}^{\frac{1}{2}}{x^2dx}\\ &=\frac{1}{4} \end{align} $\blacksquare$
別解
順序統計量の確率密度関数の公式を知らない場合(クリックで表示)
最大値が $x_3$ 以下となるとき、すべての $X_j$ が $x$ 以下となるので、 \begin{align} F_3 \left(x_3\right)=P \left(X_1 \le x_3,X_2 \le x_3,X_3 \le x_3\right) \end{align} 確率変数 $X_j$ は互いに独立であるため、この確率は、 \begin{align} F_3 \left(x_3\right)&=P \left(X_1 \le x_3\right) \cdot P \left(X_2 \le x_3\right) \cdot P \left(X_3 \le x_3\right)\\ &=F \left(x\right) \cdot F \left(x\right) \cdot F \left(x\right)\\ &= \left\{F \left(x\right)\right\}^3\\ &= \left(x+0.5\right)^3 \end{align} 累積分布関数と確率密度関数の関係 $f \left(x\right)=\frac{d}{dx}F \left(x\right)$ より、 \begin{align} f_3 \left(x_3\right)=3 \left(x_3+0.5\right)^2 \end{align}
2番目の値が $x_2$ 以下となるのは、
$X_1,\ X_2,X_3$ のうち2つが $x_2$ 以下、かつ、1つが $x_2$ 以上
もしくは、
$X_1,\ X_2,X_3$ のすべてが $x_2$ 以下
のときであるから、
(a)2つが $x_2$ 以下となる確率は、
\begin{align}
P_1&={}_{3}C_2 \cdot P \left(X \le x_2\right) \cdot P \left(X \le x_2\right) \cdot P \left(X \geq x_2\right)\\
&=3 \cdot \left(x_2+0.5\right) \cdot \left(x_2+0.5\right) \cdot \left\{1- \left(x_2+0.5\right)\right\}\\
&=3 \left(x_2+0.5\right)^2 \left(-x_2+0.5\right)
\end{align}
(b)3つが $x_2$ 以下となる確率は、先の結果より、
\begin{align}
P_2= \left(x_2+0.5\right)^3
\end{align}
したがって、
\begin{align}
F_2 \left(x_2\right)&=3 \left(x_2+0.5\right)^2 \left(-x_2+0.5\right)+ \left(x_2+0.5\right)^3\\
&=-2 \left(x_2+0.5\right)^2 \left(x_2-1\right)
\end{align}
累積分布関数と確率密度関数の関係 $f \left(x\right)=\frac{d}{dx}F \left(x\right)$ より、
\begin{align}
f_2 \left(x_2\right)&=-2 \left\{2 \left(x_2+0.5\right) \left(x_2-1\right) \cdot \frac{d}{dx} \left(x_2+0.5\right)+ \left(x_2+0.5\right)^2 \cdot 1\right\}\\
&=-2 \left(x_2+0.5\right) \left(2x_2-2+x_2+0.5\right)\\
&=-2 \left(x_2+0.5\right) \left(3x_2-1.5\right)\\
&=-2 \left(3x_2^2-1.5x_2+1.5x_2-0.75\right)\\
&=6 \left(0.25-x_2^2\right)
\end{align}
最小値が $x_1$ 以下となるとき、少なくとも1つの $X_i$ が $x_1$ 以下となる。これは、「すべての $X_i$ が $x_1$ 以上となる事象」の余事象であるから、 \begin{align} F_1 \left(x\right)=1-P \left(x_1 \le X_1,x_1 \le X_2,x_1 \le X_3\right) \end{align} 確率変数 $X_j$ は互いに独立であるため、この確率は、 \begin{align} F_1 \left(x\right)=1-P \left(x_1 \le X_1\right) \cdot P \left(x_1 \le X_2\right) \cdot P \left(x_1 \le X_3\right) \end{align} 確率の基本性質 $P \left(x \le X\right)=1-P \left(X \le x\right)$ より、 \begin{align} F_1 \left(x_1\right)&=1- \left[ \left\{1-F \left(x_1\right)\right\} \cdot \left\{1-F \left(x_1\right)\right\} \cdot \left\{1-F \left(x_1\right)\right\}\right]\\ &=1- \left\{1-F \left(x_1\right)\right\}^3\\ &=1- \left(0.5-x_1\right)^3 \end{align} 累積分布関数と確率密度関数の関係 $f \left(x\right)=\frac{d}{dx}F \left(x\right)$ より、 \begin{align} f_1 \left(x_1\right)&=-3 \left(0.5-x_1\right)^2 \cdot \frac{d}{dx} \left(0.5-x_1\right)\\ &=-3 \left(0.5-x_1\right)^2 \cdot \left(-1\right)\\ &=3 \left(0.5-x_1\right)^2 \end{align}
〔2〕同時確率密度関数
順序統計量 $X_{ \left(1\right)},X_{ \left(2\right)},X_{ \left(3\right)}$ の同時分布関数 \begin{align} F \left(x_1,x_2,x_3\right)=P \left\{X_{ \left(1\right)} \le x_1,X_{ \left(2\right)} \le x_2,X_{ \left(3\right)} \le x_3\right\} \end{align} について考えると、 これは、 最小値が $x_1$ 以下の値、2番目が $x_2$ 以下の値、最大値が $x_3$ 以下の値 を取る同時確率と言い換えることができる。
このような状況となるためには、 \begin{align} -0.5 \le x_1 \le x_2 \le x_3 \le 0.5 \end{align} の条件下において、 3つのうち1つが \begin{align} -0.5 \le X \le x_1 \end{align} 残り2つのうち1つが \begin{align} x_1 \le X \le x_2 \end{align} 残りの1つが \begin{align} x_2 \le X \le x_3 \end{align} という値を取ればよい。
この確率は、最小値の取り方が3通り、2番目の値の取り方が2通り、最大値の取り方は残りの1通りなので、 \begin{align} F \left(x_1,x_2,x_3\right)&=3F \left(x_1\right) \cdot 2 \left\{F \left(x_2\right)-F \left(x_1\right)\right\} \cdot \left\{F \left(x_3\right)-F \left(x_2\right)\right\}\\ &=3 \left(x_1+0.5\right) \cdot 2 \left\{ \left(x_2+0.5\right)- \left(x_1+0.5\right)\right\} \cdot \left\{ \left(x_3+0.5\right)- \left(x_2+0.5\right)\right\}\\ &=6 \left(x_1+0.5\right) \left(x_2-x_1\right) \left(x_3-x_2\right)\\ &=6 \left\{x_1x_2x_3+ \left(x_1^2x_2-x_1^2x_3-x_1x_2^2\right)+0.5 \left(x_1x_2+x_2x_3-x_3x_1-x_2^2\right)\right\} \end{align} 同時分布関数と同時確率密度関数の関係より、 \begin{align} f \left(x_1,x_2,x_3\right)&=\frac{\partial^3}{\partial x_1\partial x_2\partial x_3}F \left(x_1,x_2,x_3\right)\\ &=6 \end{align} したがって、 \begin{align} f \left(x_1,x_2,x_3\right)= \left\{\ \begin{matrix}6&-0.5 \lt x_1 \le x_2 \le x_3 \lt 0.5\ \\0&\mathrm{other}\\\end{matrix}\right. \end{align} $\blacksquare$
〔3〕不偏推定量
確率変数 $Y_{ \left(1\right)},Y_{ \left(2\right)},Y_{ \left(3\right)}$ の期待値は、〔1〕の結果と期待値の性質より、 \begin{align} E \left[Y_{ \left(1\right)}\right]&=E \left[X_{ \left(1\right)}+\theta\right]\\ &=E \left[X_{ \left(1\right)}\right]+\theta\\ &=-\frac{1}{4}+\theta \end{align} \begin{align} E \left[Y_{ \left(2\right)}\right]&=E \left[X_{ \left(2\right)}+\theta\right]\\ &=E \left[X_{ \left(2\right)}\right]+\theta\\ &=\theta \end{align} \begin{align} E \left[Y_{ \left(3\right)}\right]&=E \left[X_{ \left(3\right)}+\theta\right]\\ &=E \left[X_{ \left(3\right)}\right]+\theta\\ &=\frac{1}{4}+\theta \end{align} 与えられた推定量の期待値は、 \begin{align} E \left({\hat{\theta}}_c\right)&=E \left[cY_{ \left(1\right)}+ \left(1-2c\right)Y_{ \left(2\right)}+cY_{ \left(3\right)}\right]\\ &=cE \left[Y_{ \left(1\right)}\right]+ \left(1-2c\right)E \left[Y_{ \left(2\right)}\right]+cE \left[Y_{ \left(3\right)}\right]\\ &=c \left(-\frac{1}{4}+\theta\right)+ \left(1-2c\right)\theta+c \left(\frac{1}{4}+\theta\right)\\ &=\theta \end{align} したがって、${\hat{\theta}}_c$ は $c$ の値によらず、不偏推定量である。 $\blacksquare$
〔4〕十分統計量
確率変数 $Y_{ \left(i\right)}$ は、$X_{ \left(i\right)}$ を $\theta$ だけ平行移動しただけなので、〔2〕の結果より、 \begin{align} h \left(y_1,y_2,y_3\right)= \left\{\ \begin{matrix}6&-0.5+\theta \lt y_1 \le y_2 \le y_3 \lt 0.5+\theta\\0&\mathrm{other}\\\end{matrix}\right. \end{align} 観測値 $ \left(y_1,y_2,y_3\right)$ が得られる尤度関数は、定義域を $\theta$ を中心に書き換えると、 \begin{align} L \left(\theta\right)= \left\{\ \begin{matrix}6&y_3-0.5 \lt \theta \lt y_1+0.5\ \\0&\mathrm{other}\\\end{matrix}\right. \end{align} これは、条件を満たす場合は $1$、それ以外の場合は $0$ を取る指示関数 $I$ を用いて、 \begin{align} L \left(\theta\right)=6I \left[y_3-0.5 \lt \theta \lt y_1+0.5\right] \end{align} と表すことができる。 これは、$ \left(y_1,y_3\right)$ のみの関数なので、フィッシャー・ネイマンの因子分解定理より、確率変数の組 $ \left\{Y_{ \left(1\right)},Y_{ \left(3\right)}\right\}$ は、$\theta$ の十分統計量である。 $\blacksquare$
〔5〕ラオ・ブラックウェルの定理
確率変数 $Y_i$ の確率密度関数と累積分布関数は、 \begin{gather} G \left(y\right)= \left\{\ \begin{matrix}0&-0.5+\theta \lt y\\y-0.5+\theta&-0.5+\theta \le y \le 0.5+\theta\\1&y \lt 0.5+\theta\\\end{matrix}\right.\\ g \left(y\right)= \left\{\ \begin{matrix}1&-0.5+\theta \le y \le 0.5+\theta\\0&\mathrm{other}\\\end{matrix}\right. \end{gather}
順序統計量 $Y_{ \left(i\right)},Y_{ \left(j\right)}$ の同時確率密度関数の公式 \begin{align} g \left(y_i,y_j\right)=\frac{n!}{ \left(i-1\right)! \left(j-i-1\right)! \left(n-j\right)!} \cdot \left\{G \left(y_i\right)\right\}^{i-1} \cdot g \left(y_i\right) \cdot \left\{G \left(y_j\right)-G \left(y_i\right)\right\}^{j-i-1} \cdot g \left(y_j\right) \cdot \left\{1-G \left(y_j\right)\right\}^{n-j} \end{align} を用いると、 \begin{align} g \left(y_1,y_3\right)&=\frac{3!}{ \left(1-1\right)! \left(3-1-1\right)! \left(3-3\right)!} \cdot \left(y_1-0.5+\theta\right)^{1-1} \cdot 1 \cdot \left\{y_3-0.5+\theta- \left(y_1-0.5+\theta\right)\right\}^{3-1-1} \cdot 1 \cdot \left\{1- \left(y_1-0.5+\theta\right)\right\}^{3-3}\\ &=6 \left(y_3-y_1\right) \end{align} 順序統計量 $Y_{ \left(1\right)},Y_{ \left(2\right)},Y_{ \left(3\right)}$ の同時確率密度関数は、〔2〕と同様に考えて、 \begin{align} g \left(y_1,y_2,y_3\right)= \left\{\ \begin{matrix}6&-0.5+\theta \lt y_1 \le y_2 \le y_3 \lt 0.5+\theta\ \\0&\mathrm{other}\\\end{matrix}\right. \end{align}
条件付き確率密度関数の定義より、 \begin{align} g \left(y_2\middle|\ y_1,y_3\right)&=\frac{g \left(y_1,y_2,y_3\right)}{g \left(y_1,y_3\right)}\\ &=\frac{6}{6 \left(y_3-y_1\right)}\\ &=\frac{1}{y_3-y_1} \end{align} これは、区間 $ \left(y_1,y_3\right)$ の連続一様分布の確率密度関数なので、連続一様分布の期待値の公式より、 \begin{align} E \left(Y_2\middle|\ y_1,y_3\right)=\frac{y_1+y_3}{2} \end{align} ここで、〔3〕において定義された不偏推定量 ${\hat{\theta}}_c$ について、十分統計量 $ \left(y_1,y_3\right)$ で条件づけた条件付き期待値は、 \begin{align} E \left({\hat{\theta}}_c\middle|\ y_1,y_3\right)&=E \left[cy_1+ \left(1-2c\right)Y_{ \left(2\middle| y_1,y_3\right)}+cy_3\right]\\ &=cy_1+ \left(1-2c\right) \cdot E \left(Y_2\middle| y_1,y_3\right)+cy_3\\ &=cy_1+\frac{ \left(1-2c\right) \left(y_1+y_3\right)}{2}+cy_3\\ &=\frac{y_1+y_3}{2} \end{align} ラオ・ブラックウェルの定理を用いて、${\hat{\theta}}_c$ を元に改良した推定量 ${\widetilde{\theta}}_c$ の導出を試みると、 \begin{align} {\widetilde{\theta}}_c=E \left({\hat{\theta}}_c\middle|\ y_1,y_3\right) \end{align} とすれば、分散を最小にすることができる。 したがって、 \begin{align} cY_{ \left(1\right)}+ \left(1-2c\right)Y_{ \left(2\right)}+cY_{ \left(3\right)}=\frac{Y_{ \left(1\right)}+Y_{ \left(3\right)}}{2} \end{align} これを満たすのは、 \begin{align} c=\frac{1}{2} \end{align} であり、 〔3〕の結果より、${\hat{\theta}}_c$ を元に改良した推定量は、$c$ の値によらず、不偏推定量である。 $\blacksquare$
0 件のコメント:
コメントを投稿