本稿では、正規分布の母平均の差に関する検定(対応のあるt検定)を導出しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- $t_\alpha \left(n\right)$ は自由度 $n$ の $\mathrm{t}$分布の上側 $100\alpha\%$ 点を表しています。
データの形式
対応のある確率変数 $X,Y$ がある程度の相関をもって(=互いに独立ではなく)正規分布 \begin{align} X \sim \left(\mu_X,\sigma_X^2\right) \quad Y \sim \left(\mu_Y,\sigma_Y^2\right) \end{align} に従い、 これらの分布からの大きさ $n$ の無作為対標本を \begin{align} \boldsymbol{X}= \left\{\begin{matrix}X_1,Y_1\\X_2,Y_2\\\vdots\\X_n,Y_n\\\end{matrix}\right\} \end{align} とする。 また、それぞれの標本平均を \begin{align} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \quad \bar{Y}=\frac{1}{n}\sum_{i=1}^{n}Y_i\\ \end{align} 観測値の差とその平均値を \begin{gather} d_i=X_i-Y_i\\ \bar{d}=\bar{X}-\bar{Y} \end{gather} 観測値の差の標本不偏分散を \begin{align} s_d^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(d_i-\bar{d}\right) \end{align} とする。
【定理】正規分布の母平均の差に関する検定(対応のあるt検定)
【定理】
正規分布の母平均の差に関する検定(対応のあるt検定)
Paired t-Test
この正規分布の母平均の差 $d=\mu_X-\mu_Y$ に関する検定問題
(I)両側検定
\begin{align}
H_0:d=0 \quad H_1:d \neq 0
\end{align}
(II-A)片側検定A
\begin{align}
H_0:d \le 0 \quad H_1:d \gt 0
\end{align}
(II-B)片側検定B
\begin{align}
H_0:d \geq 0 \quad H_1:d \lt 0
\end{align}
を考える場合、
検定統計量を
\begin{align}
t_0=\frac{\sqrt n \left(\bar{X}-\bar{Y}\right)}{s_d}
\end{align}
として、
(I)両側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n-1\right) \le t_0 \le t_{0.5\alpha} \left(n-1\right)&\mathrm{0:Accept\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n-1\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n-1\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II)片側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力検定となる。
(II-A)片側検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n-1\right)&\mathrm{0:Accept\ }H_0\\t_\alpha \left(n-1\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_\alpha \left(n-1\right) \lt t_0&\mathrm{0:Accept\ }H_0\\t_0 \le -t_\alpha \left(n-1\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
Step.1 尤度比の算出
正規分布の母平均の最尤推定量は、 \begin{align} {\hat{\mu}}_X=\frac{1}{n}\sum_{i=1}^{n}X_i \quad {\hat{\mu}}_Y=\frac{1}{n}\sum_{i=1}^{n}Y_i \end{align} 帰無仮説における各パラメータを $H_0:\mu_X=\mu_Y=\mu$ として、両仮説の尤度比 $\lambda$ を計算すると(算出過程は省略)、 \begin{align} \lambda&=\frac{L \left(\mu_X=\mu,\mu_Y=\mu;\boldsymbol{x},\boldsymbol{y}\right)}{L \left(\mu_X=\bar{x},\mu_Y=\bar{y};\boldsymbol{x},\boldsymbol{y}\right)}\\ &=\frac{\prod_{i=1}^{n}f \left(x_i;\mu_X=\mu\right) \cdot \prod_{i=1}^{n}f \left(y_i;\mu_Y=\mu\right)}{\prod_{i=1}^{n}f \left(x_i;\mu_X=\bar{x}\right) \cdot \prod_{i=1}^{n}f \left(y_i;\mu_Y=\bar{y}\right)}= \cdots \\ &=\mathrm{exp} \left\{-\frac{n \left(\bar{x}-\mu\right)^2}{2\sigma_X^2}-\frac{n \left(\bar{y}-\mu\right)^2}{2\sigma_Y^2}\right\}\\ &=h \left(\bar{x}-\bar{y}\right) \end{align} したがって、検定統計量 $T \left(\boldsymbol{X},\boldsymbol{Y}\right)=\bar{x}-\bar{y}$ が考えられる。Step.2 検定統計量の対立仮説・帰無仮説における分布
期待値の性質 $E \left(X-Y\right)=E \left(X\right)-E \left(Y\right)$ より、観測値の差の期待値は、 \begin{gather} E \left(d\right)=E \left(X\right)-E \left(Y\right)=\mu_X-\mu_Y \end{gather} 同様に、分散の性質 $V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right)$ より、観測値の差の分散は、 \begin{gather} V \left(d\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right)=\sigma_X^2+\sigma_Y^2-2\mathrm{Cov} \left(X,Y\right) \end{gather} しかし、共分散(や相関係数)は一般に未知であるため、$d$ の分散を正確に求めることはできない。
そのため、この未知の分散を \begin{gather} V \left(d\right)=\sigma_d^2 \end{gather} とおくと、 正規分布の再生性より、 \begin{align} d \sim N \left(\mu_X-\mu_Y,\sigma_d^2\right) \end{align}
(i)対立仮説における分布正規分布の標本平均の差の分布は、 \begin{align} \bar{d} \sim N \left(\mu_X-\mu_Y,\frac{\sigma_d^2}{n}\right) \end{align} (ii)帰無仮説における分布
帰無仮説 $H_0:\mu_X=\mu_Y$ における標本平均の差の分布は、 \begin{align} \hat{d} \sim N \left(0,\frac{\sigma_d^2}{n}\right) \end{align} 確率変数 $d$ の分散 $\sigma_d^2$ を標本不偏分散で推定すると、 \begin{align} {\hat{\sigma}}_d^2=s_d^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(d_i-\bar{d}\right) \end{align} 帰無仮説において、標本平均の差 $\bar{d}$ を標本不偏分散で標準化した値を \begin{align} t_0=\frac{\sqrt n \left(\bar{X}-\bar{Y}\right)}{s_d} \end{align} とすると、 \begin{align} t_0 \sim \mathrm{t} \left(n-1\right) \end{align}
Step.3 検定関数と棄却域の型
(I)両側検定
ネイマン・ピアソンの基本定理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}a \le T \left(\boldsymbol{X}\right) \le b&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \lt a \quad \mathrm{or} \quad b \lt T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{1}
\end{align}
(II)片側検定
ネイマン・ピアソンの基本定理と単調尤度比の原理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力検定となる。
検定A
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}T \left(\boldsymbol{X}\right) \lt a&\mathrm{0:Hold\ }H_0\\a \le T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{2}
\end{align}
検定B
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}b \lt T \left(\boldsymbol{X}\right)&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \le b&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{3}
\end{align}
Step.4 棄却域の設定
(I)両側検定
パーセント点の定義と$\mathrm{t}$ 分布の対称性から、
\begin{align}
P \left\{-t_{0.5\alpha} \left(n-1\right) \le t_0 \le t_{0.5\alpha} \left(n-1\right)\right\}=1-\alpha
\end{align}
したがって、式 $(1)$ において、$a=-t_{0.5\alpha} \left(n-1\right),b=t_{0.5\alpha} \left(n-1\right)$ とすると、
\begin{gather}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n-1\right) \le t_0 \le t_{0.5\alpha} \left(n-1\right)&\mathrm{0:Hold\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n-1\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n-1\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{gather}
(II-A)片側検定A
パーセント点の定義より、
\begin{align}
P \left\{t_0 \le t_\alpha \left(n-1\right)\right\}=1-\alpha
\end{align}
したがって、式 $(2)$ において、$a=t_\alpha \left(n-1\right)$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n-1\right)&\mathrm{0:Hold\ }H_0\\t_\alpha \left(n-1\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
(II-B)片側検定B
パーセント点の定義より、
\begin{align}
P \left\{-t_\alpha \left(n-1\right) \le t_0\right\}=1-\alpha
\end{align}
したがって、式 $(3)$ において、$b=-t_\alpha \left(n-1\right)$ とすると、
\begin{align}
\varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_\alpha \left(n-1\right) \lt t_0&\mathrm{0:Hold\ }H_0\\t_0 \le -t_\alpha \left(n-1\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.
\end{align}
$\blacksquare$
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.129
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.277
0 件のコメント:
コメントを投稿