統計検定 1級 2015年 統計数理 問5 組標本に関する問題

公開日: 更新日:

【2023年5月4週】 【B000】数理統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2015年に実施された統計検定1級『統計数理』 問5の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 著作権の関係上、問題文は、掲載することができません。申し訳ありませんが、閲覧者のみなさまでご用意いただければ幸いです。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕標本平均と標本不偏分散の分割

(i)標本平均
定義式を変形すると、 \begin{align} \bar{y}&=\frac{1}{n}\sum_{i=1}^{n}y_i\\ &=\frac{1}{n} \left(\sum_{i=1}^{n_1}y_i+\sum_{i=n_1+1}^{n}y_i\right) \end{align} ここで、 \begin{gather} {\bar{y}}_1=\frac{1}{n_1}\sum_{i=1}^{n_1}y_i\Leftrightarrow n_1{\bar{y}}_1=\sum_{i=1}^{n_1}y_i\\ {\bar{y}}_2=\frac{1}{n_2}\sum_{i=n_1+1}^{n}y_i\Leftrightarrow n_2{\bar{y}}_2=\sum_{i=n_1+1}^{n}y_i \end{gather} よって、 \begin{align} \bar{y}=\frac{n_1{\bar{y}}_1+n_2{\bar{y}}_2}{n} \end{align}

(ii)標本不偏分散
$s_1^2$ の定義式を変形すると、 \begin{align} s_1^2&=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left(y_i-{\bar{y}}_1\right)^2\\ &=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left\{ \left(y_i-\bar{y}\right)- \left({\bar{y}}_1-\bar{y}\right)\right\}^2\\ &=\frac{1}{n_1-1}\sum_{i=1}^{n_1} \left\{ \left(y_i-\bar{y}\right)^2-2 \left(y_i-\bar{y}\right) \left({\bar{y}}_1-\bar{y}\right)+ \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\ &=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-2 \left({\bar{y}}_1-\bar{y}\right)\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)+n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\tag{1} \end{align} ここで、 \begin{align} \left({\bar{y}}_1-\bar{y}\right)\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)&= \left({\bar{y}}_1-\bar{y}\right) \left(\sum_{i=1}^{n_1}y_i-n_1\bar{y}\right)\\ &= \left({\bar{y}}_1-\bar{y}\right) \left(n_1{\bar{y}}_1-n_1\bar{y}\right)\\ &=n_1 \left({\bar{y}}_1-\bar{y}\right)^2 \end{align} よって、式 $(1)$ より、 \begin{align} s_1^2&=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-2n_1 \left({\bar{y}}_1-\bar{y}\right)^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\ &=\frac{1}{n_1-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2-n_1 \left({\bar{y}}_1-\bar{y}\right)^2\right\}\\ \sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2&= \left(n_1-1\right)s_1^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2 \end{align} 同様に、 \begin{align} \sum_{i=n_1+1}^{n} \left(y_i-\bar{y}\right)^2&= \left(n_2-1\right)s_2^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2 \end{align} したがって、$s^2$ の定義式より、 \begin{align} s^2&=\frac{1}{n-1}\sum_{i=1}^{n} \left(y_i-\bar{y}\right)^2\\ &=\frac{1}{n-1} \left\{\sum_{i=1}^{n_1} \left(y_i-\bar{y}\right)^2+\sum_{i=n_1+1}^{n} \left(y_i-\bar{y}\right)^2\right\}\\ &=\frac{1}{n-1} \left\{ \left(n_1-1\right)s_1^2+n_1 \left({\bar{y}}_1-\bar{y}\right)^2+ \left(n_2-1\right)s_2^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2\right\}\tag{2} \end{align} ここで、 \begin{align} n_1 \left({\bar{y}}_1-\bar{y}\right)^2+n_2 \left({\bar{y}}_2-\bar{y}\right)^2&=n_1 \left({\bar{y}}_1^2-2{\bar{y}}_1\bar{y}+{\bar{y}}^2\right)+n_2 \left({\bar{y}}_2^2-2{\bar{y}}_2\bar{y}+{\bar{y}}^2\right)\\ &=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-2\bar{y} \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)+ \left(n_1+n_2\right){\bar{y}}^2\\ &=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-2\bar{y} \cdot n\bar{y}+ \left(n_1+n_2\right){\bar{y}}^2\\ &=n_1{\bar{y}}_1^2+n_2{\bar{y}}_2^2-n \cdot \frac{1}{n^2} \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)^2\\ &=\frac{ \left(nn_1-n_1^2\right)}{n}{\bar{y}}_1^2+\frac{ \left(nn_2-n_2^2\right)}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\ &=\frac{n_1 \left(n-n_1\right)}{n}{\bar{y}}_1^2+\frac{n_2 \left(n-n_2\right)}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\ &=\frac{n_1n_2}{n}{\bar{y}}_1^2+\frac{n_1n_2}{n}{\bar{y}}_2^2-\frac{2n_1n_2}{n}{\bar{y}}_1{\bar{y}}_2\\ &=\frac{n_1n_2}{n} \left({\bar{y}}_1-{\bar{y}}_2\right)^2\\ \end{align} したがって、式 $(2)$ より、 \begin{align} s^2&=\frac{1}{n-1} \left\{ \left(n_1-1\right)s_1^2+ \left(n_2-1\right)s_2^2+\frac{n_1n_2}{n} \left({\bar{y}}_1-{\bar{y}}_2\right)^2\right\} \end{align} $\blacksquare$

〔2〕相関係数の算出

問題文の状況を、以下の確率変数の組が得られたと読み替える。 \begin{align} \left(\boldsymbol{X},\boldsymbol{Y}\right)= \left\{\begin{matrix}x_1,y_1\\x_2,y_2\\\vdots\\x_n,y_n\\\end{matrix}\right\} \end{align} ただし、 \begin{align} X_i= \left\{\begin{matrix}a&i=1, \cdots ,n_1\\-a&i=n_1+1, \cdots ,n\\\end{matrix}\right. \end{align} 問題文の定義より、確率変数 $Y$ の期待値と分散は、 \begin{align} E \left(Y\right)=\bar{y} \quad V \left(Y\right)=s^2 \end{align}

(i)確率変数 $X$ の期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、 \begin{align} E \left(X\right)&=\sum_{i=1}^{n}{x_i \cdot \frac{1}{n}}\\ &=\frac{1}{n} \left(\sum_{i=1}^{n_1}a-\sum_{i=n_1+1}^{n}a\right)\\ &=\frac{1}{n} \left(n_1a-n_2a\right)\\ &=\frac{a \left(n_1-n_2\right)}{n} \end{align}

(ii)確率変数 $X$ の分散
2乗の期待値の定義式 $E \left(X^2\right)=\sum_{x=-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より、 \begin{align} E \left(X^2\right)&=\sum_{i=1}^{n}{x_i^2 \cdot \frac{1}{n}}\\ &=\frac{1}{n} \left(\sum_{i=1}^{n_1}a^2+\sum_{i=n_1+1}^{n}a^2\right)\\ &=\frac{1}{n} \left(n_1a^2+n_2a^2\right)\\ &=\frac{a^2 \left(n_1+n_2\right)}{n}\\ &=a^2 \end{align} 分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、 \begin{align} V \left(X\right)&=\frac{n}{n-1} \left\{a^2-\frac{a^2 \left(n_1-n_2\right)^2}{n^2}\right\}\\ &=\frac{a^2}{n \left(n-1\right)} \left\{n^2- \left(n_1-n_2\right)^2\right\}\\ &=\frac{a^2}{n \left(n-1\right)} \left\{ \left(n_1+n_2\right)^2- \left(n_1-n_2\right)^2\right\}\\ &=\frac{a^2}{n \left(n-1\right)} \cdot 4n_1n_2\\ \end{align}

(iii)積の期待値
積の期待値の定義式 $E \left(XY\right)=\sum_{x=-\infty}^{\infty}\sum_{y=-\infty}^{\infty}{xy \cdot f \left(x,y\right)}$ より、 \begin{align} E \left(XY\right)&=\sum_{i=1}^{n}{x_iy_i \cdot \frac{1}{n}}\\ &=\frac{1}{n} \left(\sum_{i=1}^{n_1}{ay_i}-\sum_{i=n_1+1}^{n}{ay_i}\right)\\ &=\frac{1}{n} \left(an_1{\bar{y}}_1-an_2{\bar{y}}_2\right)\\ &=\frac{a \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)}{n} \end{align}

(iv)共分散
共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、 \begin{align} \mathrm{Cov} \left(X,Y\right)&=\frac{n}{n-1} \left\{\frac{a \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)}{n}-\frac{a \left(n_1-n_2\right)}{n} \cdot \bar{y}\right\}\\ &=\frac{a}{n-1} \left\{ \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)- \left(n_1-n_2\right) \left(\frac{n_1{\bar{y}}_1+n_2{\bar{y}}_2}{n}\right)\right\}\\ &=\frac{a}{n \left(n-1\right)} \left\{n \left(n_1{\bar{y}}_1-n_2{\bar{y}}_2\right)- \left(n_1-n_2\right) \left(n_1{\bar{y}}_1+n_2{\bar{y}}_2\right)\right\}\\ &=\frac{a}{n \left(n-1\right)} \left\{nn_1{\bar{y}}_1- \left(n_1-n_2\right)n_1{\bar{y}}_1-nn_2{\bar{y}}_2- \left(n_1-n_2\right)n_2{\bar{y}}_2\right\}\\ &=\frac{a}{n \left(n-1\right)} \left(2n_1n_2{\bar{y}}_1-2n_1n_2{\bar{y}}_2\right)\\ &=\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right)\\ \end{align}

(v)相関係数
相関係数の定義式 $\rho_{xy}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_x \cdot \sigma_y}$ より、 \begin{align} \rho_{xy}&=\frac{\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right)}{\sqrt{\frac{a^2}{n \left(n-1\right)} \cdot 4n_1n_2} \cdot \sqrt{s^2}}\\ &=\frac{2an_1n_2}{n \left(n-1\right)} \left({\bar{y}}_1-{\bar{y}}_2\right) \cdot \frac{\sqrt{n \left(n-1\right)}}{2a\sqrt{n_1n_2s^2}}\\ &=\frac{\sqrt{n_1n_2}}{\sqrt{n \left(n-1\right)s^2}} \left({\bar{y}}_1-{\bar{y}}_2\right) \end{align} $\blacksquare$

〔3〕標本平均・標本不偏分散・相関係数の計算

〔1〕の結果より、標本平均の値は、 \begin{align} \bar{y}=\frac{14 \cdot 37.9+14 \cdot 28.1}{28}=33.0 \end{align} 〔1〕の結果より、標本不偏分散の値は、 \begin{align} s^2&=\frac{1}{28-1} \left\{ \left(14-1\right) \cdot 57.92+ \left(14-1\right) \cdot 44.13+\frac{14 \cdot 14}{28} \left(37.9-28.1\right)^2\right\}\\ &=74.03 \end{align} 〔2〕の結果より、標本相関係数の値は、 \begin{align} \rho_{xy}&=\frac{\sqrt{14 \cdot 14}}{\sqrt{28 \left(28-1\right) \cdot 74.03}} \left(37.9-28.1\right)\\ &=0.58 \end{align} $\blacksquare$

〔4〕標準正規分布の条件付き期待値

標準正規分布の確率密度関数は、 \begin{align} f \left(z\right)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} \end{align} 標準正規分布表より、 \begin{align} P \left(0 \le Z\right)=\frac{1}{2} \end{align} 条件付き確率密度関数の定義式より、 \begin{align} f \left(z\middle|0 \le Z\right)&=\frac{f \left(z\right)}{P \left(0 \le Z\right)}\\ &=\frac{2}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} \end{align} 条件付き期待値の定義式より、 \begin{align} E \left(Z\middle|0 \le Z\right)&=\int_{0}^{\infty}{z \cdot }f \left(z\middle|0 \le Z\right)dz\\ &=\frac{2}{\sqrt{2\pi}}\int_{0}^{\infty}{z \cdot }e^{-\frac{z^2}{2}}dz\\ &=\frac{2}{\sqrt{2\pi}} \left[-e^{-\frac{z^2}{2}}\right]_0^\infty\\ &=\frac{2}{\sqrt{2\pi}} \left\{- \left(0-1\right)\right\}\\ &=\frac{\sqrt2}{\sqrt\pi} \end{align} $\blacksquare$

〔5〕期待値と分散の算出

標準正規分布表より、 \begin{align} P \left(X \lt 0\right)=P \left(0 \le X\right)=\frac{1}{2} \end{align} (i)期待値
期待値の定義式 $E \left(X\right)=\sum_{x=-\infty}^{\infty}{x \cdot f \left(x\right)}$ より、 \begin{align} E \left(T\right)&=a \cdot P \left(0 \le X\right)-a \cdot P \left(X \lt 0\right)\\ &=a \cdot \frac{1}{2}-a \cdot \frac{1}{2}\\ &=0 \end{align} (ii)分散
2乗の期待値の定義式 $E \left(X^2\right)=\sum_{x=-\infty}^{\infty}{x^2 \cdot f \left(x\right)}$ より、 \begin{align} E \left(T^2\right)&=a^2 \cdot P \left(0 \le X\right)+ \left(-a\right)^2 \cdot P \left(X \lt 0\right)\\ &=a^2 \cdot \frac{1}{2}+a^2 \cdot \frac{1}{2}\\ &=a^2 \end{align} 分散の公式 $V \left(X\right)=E \left(X^2\right)- \left\{E \left(X\right)\right\}^2$ より、 \begin{align} V \left(X\right)=a^2-0=a^2 \end{align} $\blacksquare$

〔6〕2変量正規分布の相関係数

2変量正規分布の条件付き分布の公式より、 \begin{gather} Y \left|x\right. \sim \mathrm{N} \left\{\mu_Y+\frac{\sigma_Y}{\sigma_X}\rho \left(x-\mu_X\right), \left(1-\rho^2\right)\sigma_Y^2\right\}\\ \Rightarrow Y \left|x\right. \sim \mathrm{N} \left(\rho x,1-\rho^2\right) \end{gather} $Y$ の $0 \le X$ における条件付き期待値は、 \begin{align} E \left(Y\middle|0 \le X\right)&=\int_{0}^{\infty}{E \left(Y\middle| x\right) \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\int_{0}^{\infty}{\rho x \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\rho\int_{0}^{\infty}{x \cdot g \left(x\middle|0 \le X\right)dx}\\ &=\rho \cdot E \left(X\middle|0 \le X\right)\\ &=\frac{\sqrt2}{\sqrt\pi}\rho \end{align} $T$ と $Y$ の積の期待値は、 \begin{align} E \left(TY\right)&=\sum_{t=-a}^{a}\int_{-\infty}^{\infty}{ty \cdot f \left(t,y\right)dy}\\ &=\sum_{t=-a}^{a}\int_{-\infty}^{\infty}{ty \cdot h \left(y\right) \cdot P \left(T=t\right)dy}\\ &=\int_{-\infty}^{\infty}{ay \cdot h \left(y\middle|0 \le X\right) \cdot \frac{1}{2}dy}-\int_{-\infty}^{\infty}{ay \cdot h \left(y\middle| X \lt 0\right) \cdot \frac{1}{2}dy}\\ &=\frac{a}{2}\int_{-\infty}^{\infty}{y \cdot h \left(y\middle|0 \le X\right) \cdot d y}-\frac{a}{2}\int_{-\infty}^{\infty}{y \cdot h \left(y\middle| X \lt 0\right)dy}\\ &=\frac{a}{2} \left\{E \left(Y\middle|0 \le X\right)-E \left(Y\middle| X \lt 0\right)\right\}\\ &=\frac{a}{2} \left\{\frac{\sqrt2}{\sqrt\pi}\rho- \left(-\frac{\sqrt2}{\sqrt\pi}\rho\right)\right\}\\ &=a\rho\frac{\sqrt2}{\sqrt\pi} \end{align} 共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、 \begin{align} \mathrm{Cov} \left(X,Y\right)=a\rho\frac{\sqrt2}{\sqrt\pi}-0 \cdot \bar{y}=a\rho\frac{\sqrt2}{\sqrt\pi} \end{align} 相関係数の定義式公式 $\rho_{xy}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_x \cdot \sigma_y}$ より、 \begin{align} \xi&=a\rho\frac{\sqrt2}{\sqrt\pi} \cdot \frac{1}{\sqrt{a^2} \cdot \sqrt1}\\ &=\rho\frac{\sqrt2}{\sqrt\pi} \end{align} したがって、相関係数 $\xi$ は、定数 $a$ に依存しない。

$T$ と $Y$ の間の相関は、〔3〕においては、$n_1=n_2=14$ のとき、$ \left(\boldsymbol{X},\boldsymbol{Y}\right)= \left\{ \left(x_1,y_1\right) \cdots \left(x_n,y_n\right)\right\}$ の $x_i$ がある値より大きいとき $a$、小さいとき $-a$ として、$ \left(\boldsymbol{T},\boldsymbol{Y}\right)= \left\{ \left(a,y_1\right) \cdots \left(-a,y_n\right)\right\}$ の相関係数を求めた場合に対応する。 $\blacksquare$

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ