独立性の検定の検定統計量の公式の導出

公開日:

【2023年4月4週】 【B000】数理統計学 【B080】統計的仮説検定

この記事をシェアする
  • B!
サムネイル画像

本稿では、独立性の検定の検定統計量の公式を導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。

データの形式

あるリスク因子への曝露とある疾病の発症との関係をまとめた表が以下のようにまとめられている。サンプルサイズが十分に大きく、中心極限定理が成り立ち、母比率を標本比率で置き換えることができるとする。

表1 曝露と発症の関係(観測値)
発症あり 発症なし 合計
曝露あり a c n1
曝露なし b d n0
合計 m1 m0 N
表2 曝露と発症の関係(統計モデル)
発症あり 発症なし 合計
曝露あり π11 π12 πE
曝露なし π21 π22 1πE
合計 πD 1πD 1

【公式】独立性の検定の検定統計量の公式

【公式】
独立性の検定の検定統計量の公式
Test Statistic of Chi-Square Independence Test

帰無仮説 「曝露と発症は統計的に独立である」 を検定するための χ2検定統計量は χP2=[aE^(a)]2E^(a)+[bE^(b)]2E^(b)+[cE^(c)]2E^(c)+[dE^(d)]2E^(d) で定義される。 この検定統計量は、分割表内の値を用いて χP2=N(adbc)2n1n0m1m0 で与えられる。

導出

導出

独立性の定義 P(AB)=P(A)P(B) より、帰無仮説において、 π11=πDπEπ12=πE(1πD)π21=πD(1πE)π22=(1πD)(1πE) 各セルの度数は、 a=Nπ11=NπDπEb=Nπ12=NπE(1πD)c=Nπ21=NπD(1πE)d=Nπ22=N(1πD)(1πE) 周辺確率の最尤推定量は、それぞれ π^D=m1Nπ^E=n1N1π^D=m2N1π^E=n2N 帰無仮説のもとでの各セルの期待値の一致推定量は、 E^(a)=n1m1N=(a+c)(a+b)NE^(b)=n2m1N=(a+b)(b+d)NE^(c)=n1m2N=(a+c)(c+d)NE^(d)=n2m2N=(b+d)(c+d)N 定義式に沿って、帰無仮説における検定統計量の値を算出すると、 (1)χ02=[aE^(a)]2E^(a)+[bE^(b)]2E^(b)+[cE^(c)]2E^(c)+[dE^(d)]2E^(d) それぞれの項を計算すると、 aE^(a)=a(a+c)(a+b)N=a(a+b+c+d)(a+c)(a+b)N(2)=adbcN bE^(b)=b(a+b)(b+d)N=b(a+b+c+d)(a+b)(b+d)N(3)=adbcN cE^(c)=c(a+c)(c+d)N=c(a+b+c+d)(a+c)(c+d)N(4)=adbcN dE^(d)=d(b+d)(c+d)N=d(a+b+c+d)(b+d)(c+d)N(5)=adbcN(2)(5) を式 (1) に代入すると、 χ02=(adbcN)2{N(a+c)(a+b)+N(a+b)(b+d)+N(a+c)(c+d)+N(b+d)(c+d)}=(adbc)2N{(b+d)(c+d)+(a+c)(c+d)+(a+b)(b+d)+(a+b)(a+c)n1n0m1m0}=(adbc)2N{(a+c)(a+b+c+d)+(b+d)(a+b+c+d)n1n0m1m0}=(adbc)2N{(a+b+c+d)(a+b+c+d)n1n0m1m0}=(adbc)2NN2n1n0m1m0=N(adbc)2n1n0m1m0

参考文献

  • 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.178
  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.288-292
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.158-159

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ