本稿では、正規分布の母平均の差の信頼区間を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- $Z_\alpha,t_\alpha \left(n\right)$ はそれぞれ標準正規分布と自由度 $n$ の $\mathrm{t}$分布の上側 $100\alpha\%$ 点を表しています。
データの形式
確率変数 $X,Y$ が正規分布 \begin{align} \mathrm{N} \left(\mu_X,\sigma_X^2\right) \quad \mathrm{N} \left(\mu_Y,\sigma_Y^2\right) \end{align} に従い、 この分布からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots Y_m\right\} \end{align} それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \quad \bar{Y}=\frac{1}{m}\sum_{i=1}^{n}Y_i\\ s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right) \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right) \end{gather} 標本統合不偏分散を \begin{align} s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{align} とする。 母分散の値が未知の場合は、等しく \begin{gather} \sigma_X^2=\sigma_Y^2=\sigma^2 \end{gather} であることを仮定する。
【定理】正規分布の母平均の差の信頼区間
【定理】
正規分布の母平均の差の信頼区間
Confidence Intervals for Population Mean Difference of Normal Distributions
正規分布の母平均の差の $100 \left(1-\alpha\right)\%$ 信頼区間は、
(I)母分散が既知の場合
\begin{gather}
\left(\bar{X}-\bar{Y}\right)-\phi \cdot Z_{0.5\alpha} \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\phi \cdot Z_{0.5\alpha}\\
\phi^2=\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}
\end{gather}
(II)母分散が未知の場合
\begin{gather}
\left(\bar{X}-\bar{Y}\right)-\varphi \cdot t_{0.5\alpha} \left(n+m-2\right) \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\varphi \cdot t_{0.5\alpha} \left(n+m-2\right)\\
s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2}\\
\varphi^2=\frac{s^2}{n}+\frac{s^2}{m}
\end{gather}
で与えられる。
導出
(I)母分散が既知の場合
正規分布の標本平均は、
\begin{align}
\bar{X} \sim N \left(\mu_X,\frac{\sigma_X^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{\sigma_Y^2}{m}\right)
\end{align}
標本平均の差を $\bar{d}=\bar{X}-\bar{Y}$ とすると、正規分布の再生性により、
\begin{align}
\bar{d} \sim N \left(\mu_X-\mu_Y,\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}\right)
\end{align}
母平均の差を $d=\mu_X-\mu_Y$、標本平均の差 $\bar{d}$ を標準化した値を
\begin{gather}
Z=\frac{\bar{d}-d}{\phi}\\
\phi^2=\frac{\sigma_X^2}{n}+\frac{\sigma_Y^2}{m}
\end{gather}
とすると、
標準化変換の性質より、
\begin{align}
Z \sim N \left(0,1\right)
\end{align}
標準正規分布の対称性から、
\begin{align}
P \left(-Z_{0.5\alpha} \le Z \le Z_{0.5\alpha}\right)=1-\alpha
\end{align}
したがって、母平均の $100 \left(1-\alpha\right)\%$ 信頼区間は、
\begin{gather}
-Z_{0.5\alpha} \le \frac{\bar{d}-d}{\phi} \le Z_{0.5\alpha}\\
\left(\bar{X}-\bar{Y}\right)-\phi \cdot Z_{0.5\alpha} \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\phi \cdot Z_{0.5\alpha}
\end{gather}
$\blacksquare$
(II)母分散が未知の場合
正規分布の再生性などにより、
\begin{align}
\bar{X} \sim N \left(\mu_X,\frac{\sigma^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{\sigma^2}{m}\right)
\end{align}
標本平均の差を $\bar{d}=\bar{X}-\bar{Y}$ とすると、正規分布の再生性により、
\begin{align}
\bar{d} \sim N \left(\mu_X-\mu_Y,\frac{\sigma^2}{n}+\frac{\sigma^2}{m}\right)
\end{align}
共通の母分散を標本統合不偏分散で推定すると、
\begin{align}
s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2}
\end{align}
母平均の差を $d=\mu_X-\mu_Y$、標本平均の差 $\bar{d}$ を統合分散で標準化した値を
\begin{gather}
t=\frac{\bar{d}-d}{\varphi}\\
\varphi^2=\frac{s^2}{n}+\frac{s^2}{m}
\end{gather}
とすると、
\begin{align}
t \sim \mathrm{t} \left(m+n-2\right)
\end{align}
$\mathrm{t}$分布の対称性から、
\begin{align}
P \left\{-t_{0.5\alpha} \left(n-1\right) \le t \le t_{0.5\alpha} \left(n-1\right)\right\}=1-\alpha
\end{align}
したがって、母平均の $100 \left(1-\alpha\right)\%$ 信頼区間は、
\begin{gather}
-t_{0.5\alpha} \left(m+n-2\right) \le \frac{ \left(\bar{X}-\bar{Y}\right)- \left(\mu_X-\mu_Y\right)}{\varphi} \le t_{0.5\alpha} \left(m+n-2\right)\\
\left(\bar{X}-\bar{Y}\right)-\varphi \cdot t_{0.5\alpha} \left(m+n-2\right) \le \mu_X-\mu_Y \le \left(\bar{X}-\bar{Y}\right)+\varphi \cdot t_{0.5\alpha} \left(n-1\right)
\end{gather}
$\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.129-130
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.240-241, p.245 練習問題 ex.6.5.3
0 件のコメント:
コメントを投稿