本稿には、2013年に実施された統計検定1級『統計数理』 問2の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕正規分布の独立性の証明
正規分布の再生性より、 \begin{align} Y_n \sim \mathrm{N} \left(n\mu,n\sigma^2\right) \end{align} ここで、 \begin{align} T&=X_1-\frac{Y_n}{n}\\ &=X_1-\frac{1}{n} \left(X_1+X_2+ \cdots +X_n\right)\\ &=\frac{n-1}{n}X_1-\frac{1}{n} \left(X_2+ \cdots +X_n\right) \end{align} とおくと、 期待値の性質 $E \left(aX+bY\right)=aE \left(X\right)+bE \left(Y\right)$ より、 \begin{align} E \left(T\right)&=E \left(X_1-\frac{Y_n}{n}\right)\\ &=E \left(X_1\right)-\frac{1}{n}E \left(Y_n\right)\\ &=\mu-\frac{1}{n}n\mu\\ &=0 \end{align} 確率変数が互いに独立な時、分散の性質 $V \left(aX+bY\right)=a^2V \left(X\right)+b^2V \left(Y\right)$ より、 \begin{align} V \left(T\right)&=V \left\{\frac{n-1}{n}X_1-\frac{1}{n} \left(X_2+ \cdots +X_n\right)\right\}\\ &= \left(\frac{n-1}{n}\right)^2V \left(X_1\right)+\frac{1}{n^2}V \left(\sum_{i=2}^{n}X_i\right)\\ &=\frac{ \left(n-1\right)^2}{n^2}\sigma^2+\frac{n-1}{n^2}\sigma^2\\ &=\frac{ \left(n-1\right) \left(n-1+1\right)}{n^2}\sigma^2\\ &=\frac{n \left(n-1\right)}{n^2}\sigma^2\\ &=\frac{n-1}{n}\sigma^2 \end{align} したがって、正規分布の再生性より、 \begin{align} T \sim \mathrm{N} \left(0,\frac{n-1}{n}\sigma^2\right) \end{align}
ここから、正規分布には、「確率変数が無相関であれば、互いに独立である」との性質があることを用いて、題意を示す。
$Y_n$ と $T$ の積の期待値は、
\begin{align}
E \left(TY_n\right)&=E \left[ \left(X_1-\frac{Y_n}{n}\right)Y_n\right]\\
&=E \left(X_1Y_n-\frac{Y_n^2}{n}\right)\\
&=E \left[X_1 \left(X_1+X_2+ \cdots +X_n\right)\right]-\frac{1}{n}E \left(Y_n^2\right)\\
&=E \left[X_1^2+\sum_{i=2}^{n}{X_1X_i}\right]-\frac{1}{n}E \left(Y_n^2\right)\\
&=E \left(X_1^2\right)+E \left(\sum_{i=2}^{n}{X_1X_i}\right)-\frac{1}{n}E \left(Y_n^2\right)\\
&=E \left(X_1^2\right)+\sum_{i=2}^{n}E \left(X_1X_i\right)-\frac{1}{n}E \left(Y_n^2\right)\tag1
\end{align}
右辺の各項について、
(i)分散の公式の変形 $E \left(X^2\right)=V \left(X\right)+ \left\{E \left(X\right)\right\}^2$ より、
\begin{align}
E \left(X_1^2\right)=\sigma^2+\mu^2
\end{align}
(ii)$X_i \left(i=1,2, \cdots ,n\right)$ は、互いに独立なので、期待値の性質より、
\begin{align}
E \left(X_1X_i\right)&=E \left(X_1\right)E \left(X_i\right)\\
&=\mu^2
\end{align}
(iii)分散の公式の変形 $E \left(Y_n^2\right)=V \left(Y_n\right)+ \left\{E \left(Y_n\right)\right\}^2$ より、
\begin{align}
E \left(Y_n^2\right)&=n\sigma^2+n^2\mu^2\\
&=n \left(\sigma^2+n\mu^2\right)
\end{align}
したがって、式 $(1)$ より、
\begin{align}
E \left(TY_n\right)&= \left(\sigma^2+\mu^2\right)+ \left(n-1\right)\mu^2-\frac{n \left(\sigma^2+n\mu^2\right)}{n}\\
&=\sigma^2-\sigma^2+ \left(n-1\right)\mu^2- \left(n-1\right)\mu^2\\
&=0
\end{align}
共分散の公式 $\mathrm{Cov} \left(T,Y_n\right)=E \left(TY_n\right)-E \left(T\right)E \left(Y_n\right)$ より、
\begin{align}
\mathrm{Cov} \left(T,Y_n\right)=0-0 \cdot n\mu=0
\end{align}
ゆえに、無相関であることが示せたので、同時に、$Y_n$ と $T$ は互いに独立であることも示された。
$\blacksquare$
〔2〕総和が与えられたときの1番目の観測値の条件付き分布
確率変数の独立性の性質 $f \left(t\middle| y_n\right)=f \left(t\right)$ から、$Y_n=y_n$ が与えられたときの $T$ の条件付き分布は、 \begin{gather} \left. \left(X_1-\frac{Y_n}{n}\right)\right|y_n \sim \mathrm{N} \left(0,\frac{n-1}{n}\sigma^2\right)\\ \left( \left.X_1\right|y_n-\frac{y_n}{n}\right) \sim \mathrm{N} \left(0,\frac{n-1}{n}\sigma^2\right) \end{gather} このことから、$X_1$ の条件付き期待値は、 \begin{gather} E \left( \left.X_1\right|y_n-\frac{y_n}{n}\right)=0\\ E \left( \left.X_1\right|y_n\right)-E \left(\frac{y_n}{n}\right)=0\\ E \left( \left.X_1\right|y_n\right)=\frac{y_n}{n} \end{gather} $X_1$ の条件付き分散は、 \begin{gather} V \left( \left.X_1\right|y_n-\frac{y_n}{n}\right)=\frac{n-1}{n}\sigma^2\\ V \left( \left.X_1\right|y_n\right)=\frac{n-1}{n}\sigma^2\\ \end{gather} したがって、 \begin{gather} \left.X_1\right|y_n \sim \mathrm{N} \left(\frac{y_n}{n},\frac{n-1}{n}\sigma^2\right) \end{gather} $\blacksquare$
〔3〕k個の累積和を与えたときのk-1個の累積和の条件付き分布
〔2〕の結果より、一般の $i=1,2, \cdots ,n$ について、 \begin{gather} \left.X_i\right|y_k \sim \mathrm{N} \left(\frac{y_k}{k},\frac{k-1}{k}\sigma^2\right) \end{gather} また、$Y_{k-1}=Y_k-X_k$ なので、 \begin{align} \left.Y_{k-1}\right|y_k&= \left(Y_k-X_k\middle| y_k\right)\\ &=y_k- \left.X_k\right|y_k \end{align} $Y_{k-1}$ の条件付き期待値は、 \begin{align} E \left(Y_{k-1}\middle| y_k\right)&=E \left(Y_k-X_k\middle| y_k\right)\\ &=y_k-E \left(X_k\middle| y_k\right)\\ &=y_k-\frac{y_k}{k}\\ &=\frac{k-1}{k}y_k \end{align} $Y_{k-1}$ の条件付き分散は、 \begin{align} V \left(Y_{k-1}\middle| y_k\right)&=V \left(Y_k-X_k\middle| y_k\right)\\ &=V \left(X_k\middle| y_k\right)\\ =\frac{k-1}{k}\sigma^2 \end{align} したがって、正規分布の再生性より、 \begin{align} \left.Y_{k-1}\right|y_k \sim \mathrm{N} \left(\frac{k-1}{k}y_k,\frac{k-1}{k}\sigma^2\right) \end{align} $\blacksquare$
〔4〕条件付きの確率密度関数と総和の周辺確率密度関数
まず、確率変数 $X_i$ の確率密度関数を以下のようにおく。 \begin{align} f \left(x_i\right) \end{align} $X_k$ と部分和 $Y_{k-1}$ は独立なので、同時確率密度関数は、 \begin{align} i_{k-1} \left(y_{k-1},x_k\right)=g_{k-1} \left(y_{k-1}\right) \cdot f \left(x_k\right) \end{align} ここで、以下のように変数変換すると、 \begin{align} \left\{\begin{matrix}w=x_k\\y_k=x_k+y_{k-1}\\\end{matrix}\right.\Rightarrow \left\{\begin{matrix}x_k=w\\y_{k-1}=y_k-w\\\end{matrix}\right. \end{align} 変数変換のヤコビアンは、 \begin{align} J&= \left|\begin{matrix}\frac{\partial x_k}{\partial w}&\frac{\partial x_k}{\partial y_k}\\\frac{\partial y_{k-1}}{\partial w}&\frac{\partial y_{k-1}}{\partial y_k}\\\end{matrix}\right|\\ &= \left|\begin{matrix}1&0\\0&1\\\end{matrix}\right|\\ &= \left|1\right|\\ &=1 \end{align} したがって、$Y_{k-1}$ と $Y_k$ の同時確率密度関数は、 \begin{align} h_{k-1} \left(y_{k-1},y_k\right)&=i_{k-1} \left(y_{k-1},y_k-y_{k-1}\right) \cdot 1\\ &=g_{k-1} \left(y_{k-1}\right) \cdot f \left(x_k\right) \end{align} いっぽう、条件付き確率密度関数の定義式 $g \left(x\middle| y\right)=\frac{f \left(x,y\right)}{h \left(y\right)}$ より、 \begin{align} f_{k-1} \left(y_{k-1}\middle| y_k\right)&=\frac{h_{k-1} \left(y_{k-1},y_k\right)}{g_k \left(y_k\right)}\\ &=\frac{g_{k-1} \left(y_{k-1}\right) \cdot f \left(x_k\right)}{g_k \left(y_k\right)} \end{align} したがって、 \begin{align} \left\{\prod_{k=2}^{n}{f_{k-1} \left(y_{k-1}\middle| y_k\right)}\right\}\times g_n \left(y_n\right)&=\frac{g_1 \left(y_1\right) \cdot f \left(x_2\right)}{g_2 \left(y_2\right)} \cdot \frac{g_2 \left(y_2\right) \cdot f \left(x_3\right)}{g_3 \left(y_3\right)} \cdots \frac{g_{n-1} \left(y_{n-1}\right) \cdot f \left(x_n\right)}{g_n \left(y_n\right)} \cdot g_n \left(y_n\right)\\ &=g_1 \left(y_1\right) \cdot f \left(x_2\right) \cdot f \left(x_3\right) \cdots f \left(x_n\right) \end{align} ここで、$X_1=Y_1$ だから、 \begin{align} g_1 \left(y_1\right)=f \left(x_1\right) \end{align} よって、 \begin{align} \left\{\prod_{k=2}^{n}{f_{k-1} \left(y_{k-1}\middle| y_k\right)}\right\}\times g_n \left(y_n\right)&=f \left(x_1\right) \cdot f \left(x_2\right) \cdot f \left(x_3\right) \cdots f \left(x_n\right)\\ &=\prod_{i=1}^{n}f \left(x_i\right) \end{align} $\blacksquare$
0 件のコメント:
コメントを投稿