正規分布の母平均の差に関する検定(対応のないt検定)の導出

公開日: 更新日:

【2023年4月4週】 【B000】数理統計学 【B080】統計的仮説検定

この記事をシェアする
  • B!
サムネイル画像

本稿では、正規分布の母平均の差に関する検定(対応のないt検定)を導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • $t_\alpha \left(n\right)$ は自由度 $n$ の $\mathrm{t}$分布の上側 $100\alpha\%$ 点を表しています。

データの形式

確率変数 $X,Y$ が母分散は未知ではあるが等しい正規分布 \begin{align} \mathrm{N} \left(\mu_X,\sigma^2\right) \quad \mathrm{N} \left(\mu_Y,\sigma^2\right) \end{align} に従い、 この分布からの大きさ $n,m$ の無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,Y_2, \cdots Y_m\right\} \end{align} それぞれの標本平均と標本不偏分散を \begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \quad \bar{Y}=\frac{1}{m}\sum_{i=1}^{n}Y_i\\ s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right) \quad s_Y^2=\frac{1}{m-1}\sum_{i=1}^{m} \left(Y_i-\bar{Y}\right) \end{gather} 標本統合不偏分散を \begin{align} s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{align} とする。

【定理】正規分布の母平均の差に関する検定(対応のないt検定)

【定理】
正規分布の母平均の差に関する検定(対応のないt検定)
Student’s t-Test

正規分布の母平均の差 $d=\mu_X-\mu_Y$ に関する検定問題
(I)両側検定 \begin{align} H_0:\mu_X=\mu_Y \quad H_1:\mu_X \neq \mu_Y \end{align} (II-A)片側検定A \begin{align} H_0:\mu_X \le \mu_Y \quad H_1:\mu_X \gt \mu_Y \end{align} (II-B)片側検定B \begin{align} H_0:\mu_X \geq \mu_Y \quad H_1:\mu_X \lt \mu_Y \end{align} を考える場合、 検定統計量を \begin{gather} t_0=\frac{\bar{X}-\bar{Y}}{\varphi}\\ \varphi^2=\frac{s^2}{n}+\frac{s^2}{m}\\ s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{gather} として、 (I)両側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力不偏検定となる。 \begin{align} \varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n+m-2\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{align} (II)片側検定
以下の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)$ をもつ検定は有意水準を $\alpha$ とする一様最強力検定となる。
(II-A)片側検定A \begin{align} \varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_\alpha \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{align} (II-B)片側検定B \begin{align} \varphi \left(\theta;\boldsymbol{x},\boldsymbol{y}\right)= \left\{\begin{matrix}-t_\alpha \left(n+m-2\right) \lt t_0&\mathrm{0:Hold\ }H_0\\t_0 \le -t_\alpha \left(n+m-2\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{align}

Step.1 尤度比の算出

正規分布の母平均の最尤推定量は、 \begin{align} {\hat{\mu}}_X=\frac{1}{n}\sum_{i=1}^{n}X_i \quad {\hat{\mu}}_Y=\frac{1}{m}\sum_{i=1}^{m}Y_i \end{align} 帰無仮説における各パラメータを $H_0:\mu_X=\mu_Y=\mu$ として、両仮説の尤度比 $\lambda$ を計算すると(算出過程は省略)、 \begin{align} \lambda&=\frac{L \left(\mu_X=\mu,\mu_Y=\mu;\boldsymbol{x},\boldsymbol{y}\right)}{L \left(\mu_X=\bar{x},\mu_Y=\bar{y};\boldsymbol{x},\boldsymbol{y}\right)}\\ &=\frac{\prod_{i=1}^{n}f \left(x_i;\mu_X=\mu\right) \cdot \prod_{i=1}^{m}f \left(y_i;\mu_Y=\mu\right)}{\prod_{i=1}^{n}f \left(x_i;\mu_X=\bar{x}\right) \cdot \prod_{i=1}^{m}f \left(y_i;\mu_Y=\bar{y}\right)}= \cdots \\ &=\mathrm{exp} \left\{-\frac{n \left(\bar{x}-\mu\right)^2}{2\sigma_X^2}-\frac{m \left(\bar{y}-\mu\right)^2}{2\sigma_Y^2}\right\}\\ &=h \left(\bar{x}-\bar{y}\right) \end{align} したがって、検定統計量 $T \left(\boldsymbol{X},\boldsymbol{Y}\right)=\bar{x}-\bar{y}$ が考えられる。

Step.2 検定統計量の対立仮説・帰無仮説における分布

(i)対立仮説における分布
正規分布の標本平均は、 \begin{align} \bar{X} \sim N \left(\mu_X,\frac{\sigma_X^2}{n}\right) \quad \bar{Y} \sim N \left(\mu_Y,\frac{\sigma_Y^2}{m}\right) \end{align} 共通の分散 $\sigma^2$ を標本統合分散で推定すると、 \begin{align} {\hat{\sigma}}^2=s^2=\frac{ \left(n-1\right)s_X^2+ \left(m-1\right)s_Y^2}{n+m-2} \end{align} 標本平均の差を $\hat{d}=\bar{X}-\bar{Y}$ とすると、期待値と分散の性質と正規分布の再生性より、 \begin{align} \hat{d} \sim N \left(\mu_X-\mu_Y,\frac{s^2}{n}+\frac{s^2}{m}\right) \end{align} (ii)帰無仮説における分布
帰無仮説 $H_0:\mu_X=\mu_Y$ における標本平均の差の分布は、 \begin{align} \hat{d} \sim N \left(0,\frac{s^2}{n}+\frac{s^2}{m}\right) \end{align} 帰無仮説において、標本平均の差 $\bar{d}$ を統合分散で標準化した値を \begin{gather} t_0=\frac{\bar{X}-\bar{Y}}{\varphi}\\ \varphi^2=\frac{s^2}{n}+\frac{s^2}{m} \end{gather} とすると、 \begin{align} t_0 \sim \mathrm{t} \left(n+m-2\right) \end{align}

Step.3 検定関数と棄却域の型

(I)両側検定
ネイマン・ピアソンの基本定理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力不偏検定となる。
\begin{align} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}a \le T \left(\boldsymbol{X}\right) \le b&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \lt a \quad \mathrm{or} \quad b \lt T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{1} \end{align} (II)片側検定
ネイマン・ピアソンの基本定理と単調尤度比の原理により、次の棄却域と検定関数 $\varphi \left(\theta;\boldsymbol{x}\right)$ をもつ検定が漸近的に有意水準を $\alpha$ とする一様最強力検定となる。
検定A \begin{align} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}T \left(\boldsymbol{X}\right) \lt a&\mathrm{0:Hold\ }H_0\\a \le T \left(\boldsymbol{X}\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{2} \end{align} 検定B \begin{align} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}b \lt T \left(\boldsymbol{X}\right)&\mathrm{0:Hold\ }H_0\\T \left(\boldsymbol{X}\right) \le b&\mathrm{1:Reject\ }H_0\\\end{matrix}\right.\tag{3} \end{align}

Step.4 棄却域の設定

(I)両側検定
パーセント点の定義と$\mathrm{t}$ 分布の対称性から、 \begin{align} P \left\{-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)\right\}=1-\alpha \end{align} したがって、式 $(1)$ において、$a=-t_{0.5\alpha} \left(n+m-2\right),b=t_{0.5\alpha} \left(n+m-2\right)$ とすると、 \begin{gather} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_{0.5\alpha} \left(n+m-2\right) \le t_0 \le t_{0.5\alpha} \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_0 \le -t_{0.5\alpha} \left(n+m-2\right) \quad \mathrm{or} \quad t_{0.5\alpha} \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{gather} (II-A)片側検定A
パーセント点の定義より、 \begin{align} P \left\{t_0 \le t_\alpha \left(n+m-2\right)\right\}=1-\alpha \end{align} したがって、式 $(2)$ において、$a=t_\alpha \left(n+m-2\right)$ とすると、
\begin{align} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}t_0 \lt t_\alpha \left(n+m-2\right)&\mathrm{0:Hold\ }H_0\\t_\alpha \left(n+m-2\right) \le t_0&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{align} (II-B)片側検定B
パーセント点の定義より、 \begin{align} P \left\{-t_\alpha \left(n+m-2\right) \le t_0\right\}=1-\alpha \end{align} したがって、式 $(3)$ において、$b=-t_\alpha \left(n+m-2\right)$ とすると、
\begin{align} \varphi \left(\theta;\boldsymbol{x}\right)= \left\{\begin{matrix}-t_\alpha \left(n+m-2\right) \lt t_0&\mathrm{0:Hold\ }H_0\\t_0 \le -t_\alpha \left(n+m-2\right)&\mathrm{1:Reject\ }H_0\\\end{matrix}\right. \end{align} $\blacksquare$

参考文献

  • 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.129
  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.276

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ