本稿では、数理統計学における統計的仮説検定の基本事項についてまとめています。帰無仮説と対立仮説、検定・棄却域・検定関数、第1種の誤りと第2種の誤り、検出力と有意水準、P値などの定義の紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
はそれぞれ標準正規分布と自由度 の 分布の上側 点を表しています。
目次[非表示]
統計的仮説検定
帰無仮説と対立仮説
統計モデル
パラメータ
特に、部分集合
また、仮説を否定することを仮説を棄却する reject といい、仮説を棄却しないことを仮説を受容する accept という。
検定・棄却域・検定関数
データがどの値のときに帰無仮説を採択して、どの値のときに棄却するかという規則を一般に検定 test という。実際には、データ
実際に棄却域を、ある統計量を使って表わすこともある。このような検定に使われる統計量を検定統計量 test statistic という。また、棄却域の補集合
棄却域を次のような関数を使って表わすこともある。
特に、対立仮説が
第1種の誤りと第2種の誤り
このような検定では、実際に正しい判定をするか、または、2種類の誤りが生ずる。1つは、帰無仮説が正しいのにもかかわらず帰無仮説を棄却してしまうことで、これを第1種の誤り error of the first kind、またはタイプⅠの誤り type I error という。もう1つの誤りは、帰無仮説が正しくないにもかかわらず、帰無仮説を採択してしまうもので、これを第2種の誤り error of the second kind、またはタイプⅡの誤り type II error という。
タイプⅠの誤りの起こる確率は
たとえば、データの値にかかわらず常に帰無仮説を採択するという検定は、タイプⅠの誤りの確率は0であるが、タイプⅡの誤りの確率は1である。望ましい検定とはこれらの2つの誤りの確率が小さいものであるが、一般には、両方同時に小さくするような検定は存在しないので、1つの方法としてある決められたタイプⅠの誤りの確率をもち、その中でタイプⅡの誤りの確率を最小にする検定を選ぶやり方がある。
検出力と有意水準
すべての
つまり、実際にパラメータの値が
帰無仮説の下でのパラメータの中でタイプⅠの誤りの確率の最大のもの、つまり、
有意確率
与えられたデータの値に対して、帰無仮説を棄却できる最小の有意水準を
たとえば、ある観測値を得たところ、有意確率が0.08であったということは、有意水準が0.08以上の検定では、この観測値を基にした場合は、帰無仮説は棄却されるということで、有意水準が0.08以下の検定では、帰無仮説は棄却されないということである。有意確率は帰無仮説が正しいとしたとき、実際に得られた値(また、もっと極端な値)を観測する確率なので、有意確率はデータが帰無仮説とどのくらい一致しているか(または、食い違っているか)を示していると考えることもできる。
確率化検定
すなわち、ある実験をしたところ、
いままで見てきたような検定は、
十分統計量にもとづいた検定
統計モデル
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.250-256
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.144-147, p.159-160
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.181-188
0 件のコメント:
コメントを投稿