本稿では、正規分布の母平均の差に関する検定(対応のないt検定)を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- $t_\alpha \left(n\right)$ は自由度 $n$ の $\mathrm{t}$分布の上側 $100\alpha\%$ 点を表しています。
データの形式
確率変数 $X,Y$ が母分散は未知ではあるが等しい正規分布 \begin{align} \mathrm{N} \left(\mu_X,\sigma^2\right) \quad \mathrm{N} \left(\mu_Y,\sigma^2\right) \end{align} に従い、 この分布からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots Y_m\right\} \end{align} それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \quad \bar{Y}=\frac{1}{m}\sum_{i=1}^{n}Y_i\\ s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right) \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right) \end{gather} 標本統合不偏分散を \begin{align} s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{align} とする。
【定理】正規分布の母平均の差に関する検定(対応のないt検定)
【定理】
正規分布の母平均の差に関する検定(対応のないt検定)
Student’s t-Test
正規分布の母平均の差 $d=\mu_X-\mu_Y$ に関する検定問題
(I)両側検定
\begin{align}
H_0:\mu_X=\mu_Y \quad H_1:\mu_X \neq \mu_Y
\end{align}
(II-A)片側検定A
\begin{align}
H_0:\mu_X \le \mu_Y \quad H_1:\mu_X \gt \mu_Y
\end{align}
(II-B)片側検定B
\begin{align}
H_0:\mu_X \geq \mu_Y \quad H_1:\mu_X \lt \mu_Y
\end{align}
を考える場合、
検定統計量を
\begin{gather}
t_0=\frac{\bar{X}-\bar{Y}}{\varphi}\\
\varphi^2=\frac{s^2}{n}+\frac{s^2}{m}\\
s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2}
\end{gather}
として、
(I)両側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n+m-2\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II)片側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力検定となる。
(II-A)片側検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_\alpha \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_\alpha \left(n+m-2\right) \lt t_0&\mathrm{0:Hold\ }H_0\\t_0 \le -t_\alpha \left(n+m-2\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
Step.1 尤度比の算出
正規分布の母平均の最尤推定量は、 \begin{align} {\hat{\mu}}_X=\frac{1}{n}\sum_{i=1}^{n}X_i \quad {\hat{\mu}}_Y=\frac{1}{m}\sum_{i=1}^{m}Y_i \end{align} 帰無仮説における各パラメータを $H_0:\mu_X=\mu_Y=\mu$ として、両仮説の尤度比 $\lambda$ を計算すると(算出過程は省略)、 \begin{align} \lambda&=\frac{L \left(\mu_X=\mu,\mu_Y=\mu;\boldsymbol{x},\boldsymbol{y}\right)}{L \left(\mu_X=\bar{x},\mu_Y=\bar{y};\boldsymbol{x},\boldsymbol{y}\right)}\\ &=\frac{\prod_{i=1}^{n}f \left(x_i;\mu_X=\mu\right) \cdot \prod_{i=1}^{m}f \left(y_i;\mu_Y=\mu\right)}{\prod_{i=1}^{n}f \left(x_i;\mu_X=\bar{x}\right) \cdot \prod_{i=1}^{m}f \left(y_i;\mu_Y=\bar{y}\right)}= \cdots \\ &=\mathrm{exp} \left\{-\frac{n \left(\bar{x}-\mu\right)^2}{2\sigma_X^2}-\frac{m \left(\bar{y}-\mu\right)^2}{2\sigma_Y^2}\right\}\\ &=h \left(\bar{x}-\bar{y}\right) \end{align} したがって、検定統計量 $T \left(\boldsymbol{X},\boldsymbol{Y}\right)=\bar{x}-\bar{y}$ が考えられる。
Step.2 検定統計量の対立仮説・帰無仮説における分布
(i)対立仮説における分布
正規分布の標本平均は、
\begin{align}
\bar{X} \sim N \left(\mu_X,\frac{\sigma_X^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{\sigma_Y^2}{m}\right)
\end{align}
共通の分散 $\sigma^2$ を標本統合分散で推定すると、
\begin{align}
{\hat{\sigma}}^2=s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2}
\end{align}
標本平均の差を $\hat{d}=\bar{X}-\bar{Y}$ とすると、期待値と分散の性質と正規分布の再生性より、
\begin{align}
\hat{d} \sim N \left(\mu_X-\mu_Y,\frac{s^2}{n}+\frac{s^2}{m}\right)
\end{align}
(ii)帰無仮説における分布
帰無仮説 $H_0:\mu_X=\mu_Y$ における標本平均の差の分布は、
\begin{align}
\hat{d} \sim N \left(0,\frac{s^2}{n}+\frac{s^2}{m}\right)
\end{align}
帰無仮説において、標本平均の差 $\bar{d}$ を統合分散で標準化した値を
\begin{gather}
t_0=\frac{\bar{X}-\bar{Y}}{\varphi}\\
\varphi^2=\frac{s^2}{n}+\frac{s^2}{m}
\end{gather}
とすると、
\begin{align}
t_0 \sim \mathrm{t} \left(n+m-2\right)
\end{align}
Step.3 検定関数と棄却域の型
(I)両側検定
ネイマン・ピアソンの基本定理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}a \le T \left(\boldsymbol{X}\right) \le b&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \lt a \quad \mathrm{or} \quad b \lt T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{1}
\end{align}
(II)片側検定
ネイマン・ピアソンの基本定理と単調尤度比の原理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力検定となる。
検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}T \left(\boldsymbol{X}\right) \lt a&\mathrm{0:Hold\ }H_0\\a \le T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{2}
\end{align}
検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}b \lt T \left(\boldsymbol{X}\right)&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \le b&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{3}
\end{align}
Step.4 棄却域の設定
(I)両側検定
パーセント点の定義と$\mathrm{t}$ 分布の対称性から、
\begin{align}
P \left\{-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)\right\}=1-\alpha
\end{align}
したがって、式 $(1)$ において、$a=-t_{0.5\alpha} \left(n+m-2\right),b=t_{0.5\alpha} \left(n+m-2\right)$ とすると、
\begin{gather}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n+m-2\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{gather}
(II-A)片側検定A
パーセント点の定義より、
\begin{align}
P \left\{t_0 \le t_\alpha \left(n+m-2\right)\right\}=1-\alpha
\end{align}
したがって、式 $(2)$ において、$a=t_\alpha \left(n+m-2\right)$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_\alpha \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
パーセント点の定義より、
\begin{align}
P \left\{-t_\alpha \left(n+m-2\right) \le t_0\right\}=1-\alpha
\end{align}
したがって、式 $(3)$ において、$b=-t_\alpha \left(n+m-2\right)$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_\alpha \left(n+m-2\right) \lt t_0&\mathrm{0:Hold\ }H_0\\t_0 \le -t_\alpha \left(n+m-2\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
$\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.129
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.276
0 件のコメント:
コメントを投稿