本稿には、2015年に実施された統計検定1級『統計数理』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。
- 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
- この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
- 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
〔1〕標本平均と標本不偏分散の分割
(i)標本平均
定義式を変形すると、
\begin{align}
\bar{y}&=\frac{1}{n}\sum_{i=1}^{n}y_i\\
&=\frac{1}{n} \left(\sum_{i=1}^{n_1}y_i+\sum_{i=n_1+1}^{n}y_i\right)
\end{align}
ここで、
\begin{gather}
{\bar{y}}_1=\frac{1}{n_1}\sum_{i=1}^{n_1}y_i\Leftrightarrow n_1{\bar{y}}_1=\sum_{i=1}^{n_1}y_i\\
{\bar{y}}_2=\frac{1}{n_2}\sum_{i=n_1+1}^{n}y_i\Leftrightarrow n_2{\bar{y}}_2=\sum_{i=n_1+1}^{n}y_i
\end{gather}
よって、
\begin{align}
\bar{y}=\frac{n_1{\bar{y}}_1+n_2{\bar{y}}_2}{n}
\end{align}
(ii)標本不偏分散
$s_1^2$ の定義式を変形すると、
\begin{align}
s_1^2&=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left(y_i-{\bar{y}}_1\right)^2\\
&=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left\{ \left(y_i-\bar{y}\right)- \left({\bar{y}}_1-\bar{y}\right)\right\}^2\\
&=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left\{ \left(y_i-\bar{y}\right)^2-2 \left(y_i-\bar{y}\right) \left({\bar{y}}_1-\bar{y}\right)+ \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\
&=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-2 \left({\bar{y}}_1-\bar{y}\right)\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)+n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\tag{1}
\end{align}
ここで、
\begin{align}
\left({\bar{y}}_1-\bar{y}\right)\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)&= \left({\bar{y}}_1-\bar{y}\right) \left(\sum_{i=1}^{n_1}y_i-n_1\bar{y}\right)\\
&= \left({\bar{y}}_1-\bar{y}\right) \left(n_1{\bar{y}}_1-n_1\bar{y}\right)\\
&=n_1 \left({\bar{y}}_1-\bar{y}\right)^2
\end{align}
よって、式 $(1)$ より、
\begin{align}
s_1^2&=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-2n_1 \left({\bar{y}}_1-\bar{y}\right)^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\
&=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\
\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2&= \left(n_1-1\right)s_1^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2
\end{align}
同様に、
\begin{align}
\sum_{i=n_1+1}^{n} \left(y_i-\bar{y}\right)^2&= \left(n_2-1\right)s_2^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2
\end{align}
したがって、$s^2$ の定義式より、
\begin{align}
s^2&=\frac{1}{n-1}\sum_{i=1}^{n} \left(y_i-\bar{y}\right)^2\\
&=\frac{1}{n-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2+\sum_{i=n_1+1}^{n} \left(y_i-\bar{y}\right)^2\right\}\\
&=\frac{1}{n-1} \left\{ \left(n_1-1\right)s_1^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2+ \left(n_2-1\right)s_2^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2\right\}\tag{2}
\end{align}
ここで、
\begin{align}
n_1 \left({\bar{y}}_1-\bar{y}\right)^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2&=n_1 \left({\bar{y}}_1^2-2{\bar{y}}_1\bar{y}+{\bar{y}}^2\right)+n_2 \left({\bar{y}}_2^2-2{\bar{y}}_2\bar{y}+{\bar{y}}^2\right)\\
&=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-2\bar{y} \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)+ \left(n_1+n_2\right){\bar{y}}^2\\
&=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-2\bar{y} \cdot n\bar{y}+ \left(n_1+n_2\right){\bar{y}}^2\\
&=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-n \cdot \frac{1}{n^2} \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)^2\\
&=\frac{ \left(nn_1-n_1^2\right)}{n}{\bar{y}}_1^2+\frac{ \left(nn_2-n_2^2\right)}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\
&=\frac{n_1 \left(n-n_1\right)}{n}{\bar{y}}_1^2+\frac{n_2 \left(n-n_2\right)}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\
&=\frac{n_1n_2}{n}{\bar{y}}_1^2+\frac{n_1n_2}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\
&=\frac{n_1n_2}{n} \left({\bar{y}}_1-{\bar{y}}_2\right)^2\\
\end{align}
したがって、式 $(2)$ より、
\begin{align}
s^2&=\frac{1}{n-1} \left\{ \left(n_1-1\right)s_1^2+ \left(n_2-1\right)s_2^2+\frac{n_1n_2}{n} \left({\bar{y}}_1-{\bar{y}}_2\right)^2\right\}
\end{align}
$\blacksquare$
〔2〕相関係数の算出
問題文の状況を、以下の確率変数の組が得られたと読み替える。 \begin{align} \left(\boldsymbol{X},\boldsymbol{Y}\right)= \left\{\begin{matrix}x_1,y_1\\x_2,y_2\\\vdots\\x_n,y_n\\\end{matrix}\right\} \end{align} ただし、 \begin{align} X_i= \left\{\begin{matrix}a&i=1, \cdots ,n_1\\-a&i=n_1+1, \cdots ,n\\\end{matrix}\right. \end{align} 問題文の定義より、確率変数 $Y$ の期待値と分散は、 \begin{align} E \left(Y\right)=\bar{y} \quad V \left(Y\right)=s^2 \end{align}
(i)確率変数 $X$ の期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、
\begin{align}
E \left(X\right)&=\sum_{i=1}^{n}{x_i \cdot \frac{1}{n}}\\
&=\frac{1}{n} \left(\sum_{i=1}^{n_1}a-\sum_{i=n_1+1}^{n}a\right)\\
&=\frac{1}{n} \left(n_1a-n_2a\right)\\
&=\frac{a \left(n_1-n_2\right)}{n}
\end{align}
(ii)確率変数 $X$ の分散
2乗の期待値の定義式 $E \left(X^2\right)=\sum_{x=-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より、
\begin{align}
E \left(X^2\right)&=\sum_{i=1}^{n}{x_i^2 \cdot \frac{1}{n}}\\
&=\frac{1}{n} \left(\sum_{i=1}^{n_1}a^2+\sum_{i=n_1+1}^{n}a^2\right)\\
&=\frac{1}{n} \left(n_1a^2+n_2a^2\right)\\
&=\frac{a^2 \left(n_1+n_2\right)}{n}\\
&=a^2
\end{align}
分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、
\begin{align}
V \left(X\right)&=\frac{n}{n-1} \left\{a^2-\frac{a^2 \left(n_1-n_2\right)^2}{n^2}\right\}\\
&=\frac{a^2}{n \left(n-1\right)} \left\{n^2- \left(n_1-n_2\right)^2\right\}\\
&=\frac{a^2}{n \left(n-1\right)} \left\{ \left(n_1+n_2\right)^2- \left(n_1-n_2\right)^2\right\}\\
&=\frac{a^2}{n \left(n-1\right)} \cdot 4n_1n_2\\
\end{align}
(iii)積の期待値
積の期待値の定義式 $E \left(XY\right)=\sum_{x=-\infty}^{\infty}\sum_{y=-\infty}^{\infty}{xy \cdot f \left(x,y\right)}$ より、
\begin{align}
E \left(XY\right)&=\sum_{i=1}^{n}{x_iy_i \cdot \frac{1}{n}}\\
&=\frac{1}{n} \left(\sum_{i=1}^{n_1}{ay_i}-\sum_{i=n_1+1}^{n}{ay_i}\right)\\
&=\frac{1}{n} \left(an_1{\bar{y}}_1-an_2{\bar{y}}_2\right)\\
&=\frac{a \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)}{n}
\end{align}
(iv)共分散
共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、
\begin{align}
\mathrm{Cov} \left(X,Y\right)&=\frac{n}{n-1} \left\{\frac{a \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)}{n}-\frac{a \left(n_1-n_2\right)}{n} \cdot \bar{y}\right\}\\
&=\frac{a}{n-1} \left\{ \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)- \left(n_1-n_2\right) \left(\frac{n_1{\bar{y}}_1+n_2{\bar{y}}_2}{n}\right)\right\}\\
&=\frac{a}{n \left(n-1\right)} \left\{n \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)- \left(n_1-n_2\right) \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)\right\}\\
&=\frac{a}{n \left(n-1\right)} \left\{nn_1{\bar{y}}_1- \left(n_1-n_2\right)n_1{\bar{y}}_1-nn_2{\bar{y}}_2- \left(n_1-n_2\right)n_2{\bar{y}}_2\right\}\\
&=\frac{a}{n \left(n-1\right)} \left(2n_1n_2{\bar{y}}_1-2n_1n_2{\bar{y}}_2\right)\\
&=\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right)\\
\end{align}
(v)相関係数
相関係数の定義式 $\rho_{xy}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_x \cdot \sigma_y}$ より、
\begin{align}
\rho_{xy}&=\frac{\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right)}{\sqrt{\frac{a^2}{n \left(n-1\right)} \cdot 4n_1n_2} \cdot \sqrt{s^2}}\\
&=\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right) \cdot \frac{\sqrt{n \left(n-1\right)}}{2a\sqrt{n_1n_2s^2}}\\
&=\frac{\sqrt{n_1n_2}}{\sqrt{n \left(n-1\right)s^2}} \left({\bar{y}}_1-{\bar{y}}_2\right)
\end{align}
$\blacksquare$
〔3〕標本平均・標本不偏分散・相関係数の計算
〔1〕の結果より、標本平均の値は、 \begin{align} \bar{y}=\frac{14 \cdot 37.9+14 \cdot 28.1}{28}=33.0 \end{align} 〔1〕の結果より、標本不偏分散の値は、 \begin{align} s^2&=\frac{1}{28-1} \left\{ \left(14-1\right) \cdot 57.92+ \left(14-1\right) \cdot 44.13+\frac{14 \cdot 14}{28} \left(37.9-28.1\right)^2\right\}\\ &=74.03 \end{align} 〔2〕の結果より、標本相関係数の値は、 \begin{align} \rho_{xy}&=\frac{\sqrt{14 \cdot 14}}{\sqrt{28 \left(28-1\right) \cdot 74.03}} \left(37.9-28.1\right)\\ &=0.58 \end{align} $\blacksquare$
〔4〕標準正規分布の条件付き期待値
標準正規分布の確率密度関数は、 \begin{align} f \left(z\right)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} \end{align} 標準正規分布表より、 \begin{align} P \left(0 \le Z\right)=\frac{1}{2} \end{align} 条件付き確率密度関数の定義式より、 \begin{align} f \left(z\middle|0 \le Z\right)&=\frac{f \left(z\right)}{P \left(0 \le Z\right)}\\ &=\frac{2}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} \end{align} 条件付き期待値の定義式より、 \begin{align} E \left(Z\middle|0 \le Z\right)&=\int_{0}^{\infty}{z \cdot }f \left(z\middle|0 \le Z\right)dz\\ &=\frac{2}{\sqrt{2\pi}}\int_{0}^{\infty}{z \cdot }e^{-\frac{z^2}{2}}dz\\ &=\frac{2}{\sqrt{2\pi}} \left[-e^{-\frac{z^2}{2}}\right]_0^\infty\\ &=\frac{2}{\sqrt{2\pi}} \left\{- \left(0-1\right)\right\}\\ &=\frac{\sqrt2}{\sqrt\pi} \end{align} $\blacksquare$
〔5〕期待値と分散の算出
標準正規分布表より、
\begin{align}
P \left(X \lt 0\right)=P \left(0 \le X\right)=\frac{1}{2}
\end{align}
(i)期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、
\begin{align}
E \left(T\right)&=a \cdot P \left(0 \le X\right)-a \cdot P \left(X \lt 0\right)\\
&=a \cdot \frac{1}{2}-a \cdot \frac{1}{2}\\
&=0
\end{align}
(ii)分散
2乗の期待値の定義式 $E \left(X^2\right)=\sum_{x=-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より、
\begin{align}
E \left(T^2\right)&=a^2 \cdot P \left(0 \le X\right)+ \left(-a\right)^2 \cdot P \left(X \lt 0\right)\\
&=a^2 \cdot \frac{1}{2}+a^2 \cdot \frac{1}{2}\\
&=a^2
\end{align}
分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、
\begin{align}
V \left(X\right)=a^2-0=a^2
\end{align}
$\blacksquare$
〔6〕2変量正規分布の相関係数
2変量正規分布の条件付き分布の公式より、 \begin{gather} Y \left|x\right. \sim \mathrm{N} \left\{\mu_Y+\frac{\sigma_Y}{\sigma_X}\rho \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right\}\\ \Rightarrow Y \left|x\right. \sim \mathrm{N} \left(\rho x,1-\rho^2\right) \end{gather} $Y$ の $0 \le X$ における条件付き期待値は、 \begin{align} E \left(Y\middle|0 \le X\right)&=\int_{0}^{\infty}{E \left(Y\middle| x\right) \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\int_{0}^{\infty}{\rho x \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\rho\int_{0}^{\infty}{x \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\rho \cdot E \left(X\middle|0 \le X\right)\\ &=\frac{\sqrt2}{\sqrt\pi}\rho \end{align} $T$ と $Y$ の積の期待値は、 \begin{align} E \left(TY\right)&=\sum_{t=-a}^{a}\int_{-\infty}^{\infty}{ty \cdot f \left(t,y\right)dy}\\ &=\sum_{t=-a}^{a}\int_{-\infty}^{\infty}{ty \cdot h \left(y\right) \cdot P \left(T=t\right)dy}\\ &=\int_{-\infty}^{\infty}{ay \cdot h \left(y\middle|0 \le X\right) \cdot \frac{1}{2}dy}-\int_{-\infty}^{\infty}{ay \cdot h \left(y\middle| X \lt 0\right) \cdot \frac{1}{2}dy}\\ &=\frac{a}{2}\int_{-\infty}^{\infty}{y \cdot h \left(y\middle|0 \le X\right) \cdot d y}-\frac{a}{2}\int_{-\infty}^{\infty}{y \cdot h \left(y\middle| X \lt 0\right)dy}\\ &=\frac{a}{2} \left\{E \left(Y\middle|0 \le X\right)-E \left(Y\middle| X \lt 0\right)\right\}\\ &=\frac{a}{2} \left\{\frac{\sqrt2}{\sqrt\pi}\rho- \left(-\frac{\sqrt2}{\sqrt\pi}\rho\right)\right\}\\ &=a\rho\frac{\sqrt2}{\sqrt\pi} \end{align} 共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、 \begin{align} \mathrm{Cov} \left(X,Y\right)=a\rho\frac{\sqrt2}{\sqrt\pi}-0 \cdot \bar{y}=a\rho\frac{\sqrt2}{\sqrt\pi} \end{align} 相関係数の定義式公式 $\rho_{xy}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_x \cdot \sigma_y}$ より、 \begin{align} \xi&=a\rho\frac{\sqrt2}{\sqrt\pi} \cdot \frac{1}{\sqrt{a^2} \cdot \sqrt1}\\ &=\rho\frac{\sqrt2}{\sqrt\pi} \end{align} したがって、相関係数 $\xi$ は、定数 $a$ に依存しない。
$T$ と $Y$ の間の相関は、〔3〕においては、$n_1=n_2=14$ のとき、$ \left(\boldsymbol{X},\boldsymbol{Y}\right)= \left\{ \left(x_1,y_1\right) \cdots \left(x_n,y_n\right)\right\}$ の $x_i$ がある値より大きいとき $a$、小さいとき $-a$ として、$ \left(\boldsymbol{T},\boldsymbol{Y}\right)= \left\{ \left(a,y_1\right) \cdots \left(-a,y_n\right)\right\}$ の相関係数を求めた場合に対応する。 $\blacksquare$
0 件のコメント:
コメントを投稿