フィッシャーの正確確率検定

公開日: 更新日:

【2022年11月1週】 【A000】生物統計学 【A051】コホート研究 【A052】ケース・コントロール研究 【A073】統計的仮説検定

この記事をシェアする
  • B!
サムネイル画像

本稿では、フィッシャーの正確確率検定の正確なp値の算出方法の導出を行っています。サンプルサイズが小さく、漸近的な正規近似を前提とする独立性の検定が妥当でない場合に使える標準的な方法として非常に有名です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

【定理】フィッシャーの正確確率検定

【定理】
フィッシャーの正確確率検定
Fisher's Exact Test

マッチングなしのコホート研究(超幾何分布モデル)において、曝露群と非曝露群の発症確率に関する帰無仮説を \begin{gather} H_0:\pi_1=\pi_0 \end{gather} 対立仮説を
①両側仮説 \begin{gather} H_1:\pi_1 \neq \pi_0 \end{gather} ②右側仮説 \begin{align} H_1:\pi_1 \gt \pi_0 \end{align} ③左側仮説 \begin{align} H_1:\pi_1 \lt \pi_0 \end{align} とするとき、 帰無仮説の下で、実際に観測された分割表が得られる確率(条件付き尤度)は、 \begin{gather} P_C \left(X=a\middle| H_0\right)=\frac{n_1!n_0!m_1!m_0!}{N!a!b!c!d!} \end{gather} で与えられる。 この検定を行うための正確な $\mathrm{p}$値は
①両側仮説 \begin{gather} \mathrm{p}=\sum_{x=a_l}^{a_u}{I \left\{P_C \left(x\right) \le P_C \left(a\right)\right\} \cdot P_C \left(x\right)} \end{gather} ②右側仮説 \begin{align} {\mathrm{p}}_U=\sum_{x=a}^{a_u}{P_C \left(x\middle| H_0\right)} \end{align} ③左側仮説 \begin{align} {\mathrm{p}}_L=\sum_{x=a_l}^{a}{P_C \left(x\middle| H_0\right)} \end{align} で与えられる。 ただし、$I \left\{\bullet \right\}$ は、カッコ内の命題が真であれば1、偽であれば0を取る指示関数 \begin{gather} I \left\{\bullet \right\}= \left\{\begin{matrix}1&\mathrm{Ture}\\0&\mathrm{False}\\\end{matrix}\right. \end{gather} とする。

証明

証明

周辺度数 \begin{gather} n_1 \quad n_0 \quad m_1 \quad m_0 \end{gather} が固定されているという条件の下で、 曝露群の発症人数 $a$ が超幾何分布 \begin{align} a \sim \mathrm{HG} \left(N,n_1,m_1\right) \end{align} に従うとき、 帰無仮説の下で、実際に観測された分割表が得られる確率は、超幾何分布の確率関数より、 \begin{align} P_C \left(X=a\middle| H_0\right)&=\frac{{}_{n_1}C_a \cdot {}_{N-n_1}C_{m_1-a}}{{}_{N}C_{m_1}}\\ &=\frac{{}_{n_1}C_a \cdot {}_{n_0}C_b}{{}_{N}C_{m_1}}\\ &=\frac{n_1!}{a! \left(n_1-a\right)!} \cdot \frac{n_0!}{b! \left(n_0-b\right)!} \cdot \frac{m_1! \left(N-m_1\right)!}{N!}\\ &=\frac{n_1!}{a!c!} \cdot \frac{n_0!}{b!d!} \cdot \frac{m_1!m_0!}{N!}\\ &=\frac{n_1!n_0!m_1!m_0!}{N!a!b!c!d!} \end{align} 統計的仮説検定を行う際には、実際に得られたデータ以上に極端な値を取る確率を求めるので、正確な $\mathrm{p}$値は極端な値を取る確率の総和となる。 $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.34-36
  • Fisher, R. A.. On the interpretation of $\chi^2$ from contingency tables, and the calculation of P. Journal of the Royal Statistical Society, 1922;85 (1): 87-94. doi: https://doi.org/10.2307/2340521

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ