仮説検定の基礎

公開日: 更新日:

【2023年4月4週】 【B000】数理統計学 【B080】統計的仮説検定

この記事をシェアする
  • B!
サムネイル画像

本稿では、数理統計学における統計的仮説検定の基本事項についてまとめています。帰無仮説と対立仮説、検定・棄却域・検定関数、第1種の誤りと第2種の誤り、検出力と有意水準、P値などの定義の紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • $Z_\alpha,t_\alpha \left(n\right)$ はそれぞれ標準正規分布と自由度 $n$ の $\mathrm{t}$分布の上側 $100\ \alpha\%$ 点を表しています。

統計的仮説検定

帰無仮説と対立仮説

統計モデル \begin{gather} \left\{f \left(x:\theta\right):\theta\in\Theta\subset\boldsymbol{R}\right\} \end{gather} からの無作為標本を \begin{gather} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{gather} とする。 \begin{gather} f \left(x:\theta\right) \end{gather} は確率関数または確率密度関数である。 また、パラメータ空間を分割し、 \begin{gather} \Theta_0\subset\Theta \quad \Theta_1=\Theta-\Theta_0 \end{gather} つまり、 \begin{gather} \Theta_0 \cap \Theta_1=\emptyset \quad \Theta_0 \cup \Theta_1=\Theta \end{gather} とする。

パラメータ $\theta$ がパラメータ空間の部分集合 $\Theta_0$ に含まれるという仮説を帰無仮説 null hypothesis といい、 \begin{gather} H_0:\theta\in\Theta_0 \end{gather} と表わす。 また、 \begin{gather} H_1:\theta\in\Theta_1 \end{gather} 対立仮説 alternative hypothesis という。

特に、部分集合 $\Theta_0$ や $\Theta_1$ が1つの要素からなるとき、それらに対する仮説を単純仮説 simple hypothesis という。部分集合 $\Theta_0$ や $\Theta_1$ の要素が2つ以上のときは、複合仮説 composite hypothesis という。

また、仮説を否定することを仮説を棄却する reject といい、仮説を棄却しないことを仮説を受容する accept という。

検定・棄却域・検定関数

データがどの値のときに帰無仮説を採択して、どの値のときに棄却するかという規則を一般に検定 test という。実際には、データ \begin{gather} \boldsymbol{x}= \left\{x_1,x_2, \cdots ,x_n\right\} \end{gather} $C$ に入るときには帰無仮説を棄却し、そうでないときは、採用するという $\boldsymbol{R}^n$ の部分集合 $C$ を決めておく。このとき、部分集合 $C$ を棄却域 critical region という。

実際に棄却域を、ある統計量を使って表わすこともある。このような検定に使われる統計量を検定統計量 test statistic という。また、棄却域の補集合 $C^C$ を採択域 acceptance region ということもある。

棄却域を次のような関数を使って表わすこともある。 \begin{align} \varphi \left(\boldsymbol{x}\right)= \left\{\begin{matrix}1&\boldsymbol{x}\in C\\0&\boldsymbol{x}\notin C\\\end{matrix}\right. \end{align} このような関数を検定関数 test function, critical function という。検定関数 $\varphi$ をもつ検定を単に検定 $\varphi$ ということもある。

特に、対立仮説が \begin{gather} H_1:\theta \lt \theta_0 \quad H_1:\theta \gt \theta_0 \end{gather} の形をしている場合を片側検定 one-sidedtest \begin{gather} H_1:\theta \neq \theta_0 \end{gather} の形をしている場合を両側検定 two-sidedtest という。

第1種の誤りと第2種の誤り

このような検定では、実際に正しい判定をするか、または、2種類の誤りが生ずる。1つは、帰無仮説が正しいのにもかかわらず帰無仮説を棄却してしまうことで、これを第1種の誤り error of the first kind、またはタイプⅠの誤り type I error という。もう1つの誤りは、帰無仮説が正しくないにもかかわらず、帰無仮説を採択してしまうもので、これを第2種の誤り error of the second kind、またはタイプⅡの誤り type II error という。

タイプⅠの誤りの起こる確率は \begin{align} P \left(\boldsymbol{X}\in C\middle|\theta\in\Theta_0\right) \quad \mathrm{or} \quad P \left(\boldsymbol{X}\in C\middle|H_0\right) \end{align} である。 つまり、帰無仮説の下でデータが棄却域に入る確率である。また、タイプⅡの誤りの確率は、 \begin{align} P \left(\boldsymbol{X}\in C^C\middle|\theta\in\Theta_1\right) \quad \mathrm{or} \quad P \left(\boldsymbol{X}\in C^C\middle|H_1\right) \end{align} すなわち、対立仮説の下でデータが採択域に入る確率である。

たとえば、データの値にかかわらず常に帰無仮説を採択するという検定は、タイプⅠの誤りの確率は0であるが、タイプⅡの誤りの確率は1である。望ましい検定とはこれらの2つの誤りの確率が小さいものであるが、一般には、両方同時に小さくするような検定は存在しないので、1つの方法としてある決められたタイプⅠの誤りの確率をもち、その中でタイプⅡの誤りの確率を最小にする検定を選ぶやり方がある。

検出力と有意水準

すべての $\theta\in\Theta$ に対して、帰無仮説を棄却する確率 \begin{align} \beta \left(\theta\right)=P \left(\boldsymbol{X}\in C\right) \end{align} 検出力関数 power function という。 特に、対立仮説の下で $\theta_1\in\Theta_1$ のときの $\beta \left(\theta_1\right)$ を $\theta_1$ に対する検出力 power という。

つまり、実際にパラメータの値が $\theta_1$ であるときに(帰無仮説が正しくないとき)、帰無仮説を棄却する確率を検出力という(帰無仮説が正しくないのに帰無仮説を採択する確率はタイプⅡの誤りの確率である)。また、$\theta\in\Theta_0$ のときの $\beta \left(\theta\right)$ は帰無仮説が正しいときに帰無仮説を棄却する確率、つまり、タイプⅠの誤りの確率である。

帰無仮説の下でのパラメータの中でタイプⅠの誤りの確率の最大のもの、つまり、 \begin{gather} \alpha={\mathrm{sup}}_{\theta\in\Theta}{\beta \left(\theta\right)} \end{gather} 検定の大きさ size of a test という。 検定を行なうとき、ある値 $\alpha_0 \left(0 \lt \alpha_0 \lt 1\right)$ を前もって決め、検定の大きさが $\alpha_0$ より小さい検定を考えることがあるが、この $\alpha_0$ を検定の有意水準 level of significance または単に水準 level という。有意水準 $\alpha_0$ の検定とは、タイプⅠの誤りの確率が $\alpha_0$ 以下の検定である。

$\varphi \left(\boldsymbol{x}\right)$ を検定関数とするとその検定の検定力は、 \begin{gather} E \left[\varphi \left(\boldsymbol{X}\right)\right] \end{gather} で表わすことができる。

有意確率

与えられたデータの値に対して、帰無仮説を棄却できる最小の有意水準を $\mathrm{p}$値 p-value、または有意確率 significance probability という。

たとえば、ある観測値を得たところ、有意確率が0.08であったということは、有意水準が0.08以上の検定では、この観測値を基にした場合は、帰無仮説は棄却されるということで、有意水準が0.08以下の検定では、帰無仮説は棄却されないということである。有意確率は帰無仮説が正しいとしたとき、実際に得られた値(また、もっと極端な値)を観測する確率なので、有意確率はデータが帰無仮説とどのくらい一致しているか(または、食い違っているか)を示していると考えることもできる。

確率化検定

$\varphi \left(\boldsymbol{x}\right)$ をすべての観測値 $\boldsymbol{x}\in\boldsymbol{R}^n$ に対して区間 $ \left[0,1\right]$ の値をとる関数とする。もし、観測された値が $\boldsymbol{x}_\boldsymbol{0}$ である場合は、確率 $\varphi \left(\boldsymbol{x}_\boldsymbol{0}\right)$ で帰無仮説を棄却する検定を確率化検定 randomized test という。

すなわち、ある実験をしたところ、$\boldsymbol{x}_\boldsymbol{0}$ を観測したとする。そこで、表が出る確率が $\varphi \left(\boldsymbol{x}_\boldsymbol{0}\right)$ のコインを投げ、表が出たら帰無仮説を棄却し、裏が出たら棄却しないという検定がランダム検定である。実際には、ランダム検定は応用でよりも理論上で使われることが多い。

いままで見てきたような検定は、 \begin{align} \varphi \left(\boldsymbol{x}\right)= \left\{\begin{matrix}1&\boldsymbol{x}\in C\\0&\boldsymbol{x}\notin C\\\end{matrix}\right. \end{align} の形である。 ランダム検定の場合も含めて、 \begin{align} \varphi:\boldsymbol{R}^n\rightarrow \left[0,1\right] \end{align} なる関数を検定関数という。

十分統計量にもとづいた検定

統計モデル \begin{gather} \left\{f \left(x:\theta\right):\theta\in\Theta\right\} \end{gather} からの無作為標本を \begin{gather} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{gather} とする。 \begin{gather} S_1,S_2, \cdots ,S_r \end{gather} を $\theta$ に関する十分統計量とし、 $\varphi \left(\boldsymbol{x}\right)$ をある検定の検定関数とすると、 \begin{gather} \varphi^\ast \left(\boldsymbol{s}\right)=E \left\{\varphi \left(\boldsymbol{X}\right)\middle| s_1,s_2, \cdots ,s_r\right\} \end{gather} もまた検定関数であり、$\varphi \left(\boldsymbol{x}\right)$ と $\varphi^\ast \left(\boldsymbol{s}\right)$ での検出力関数は同じである。

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.250-256
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.144-147, p.159-160
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.181-188

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ