マクネマー検定

公開日: 更新日:

【2022年11月1週】 【A000】生物統計学 【A051】コホート研究 【A052】ケース・コントロール研究 【A061】マッチング研究 【A073】統計的仮説検定

この記事をシェアする
  • B!
サムネイル画像

本稿では、マッチング研究において用いられるマクネマー検定の検定統計量を条件付き二項分布にもとづく考え方と四項分布にもとづく考え方の2種類の方法で導出しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。

【定理】マクネマー検定

【定理】
マクネマー検定
McNemar Test

マッチングありのコホート研究において、対称性の帰無仮説 \begin{gather} H_0:\pi_{12}=\pi_{21} \end{gather} を検定するための マクネマー$\mathrm{Z}$検定統計量は、漸近的に \begin{gather} Z_M=\frac{f-g}{\sqrt{f+g}} \end{gather} マクネマー $\chi^2$検定統計量は、漸近的に \begin{gather} \chi_M^2=\frac{ \left(f-g\right)^2}{f+g} \end{gather} で与えられる。

導出①:条件付き二項分布を用いる方法

導出

この考え方においては、①抽出したものが不一致な応答であり、②応答の総数 $M=f+g$ が固定されていると仮定する。

抽出したものが不一致な応答であるという条件のもとで、それが「発症あり・発症なし $ \left(D,\bar{D}\right)$」、「発症なし・発症あり $ \left(\bar{D},D\right)$」である確率は、 \begin{align} P \left(D,\bar{D}\right)=\frac{\pi_{12}}{\pi_{12}+\pi_{21}} \quad P \left(\bar{D},D\right)=\frac{\pi_{21}}{\pi_{12}+\pi_{21}} \end{align} 不一致な応答の総数 $M=f+g$ が固定されているとの仮定のもとで、「発症あり・発症なし $ \left(D,\bar{D}\right)$」となるペア数 $f$ は、 \begin{align} f \sim \mathrm{B} \left(M,\frac{\pi_{12}}{\pi_{12}+\pi_{21}}\right) \end{align} したがって、得られた観測値が観測される確率(尤度)は、 \begin{align} P \left(f\middle| M\right)&={}_{M}C_f \left(\frac{\pi_{12}}{\pi_{12}+\pi_{21}}\right)^f \left(\frac{\pi_{21}}{\pi_{12}+\pi_{21}}\right)^g\\ &=\frac{M!}{f! \left(M-f\right)!} \left(\frac{\pi_{12}}{\pi_{12}+\pi_{21}}\right)^f \left(\frac{\pi_{21}}{\pi_{12}+\pi_{21}}\right)^g\\ &=\frac{M!}{f!g!} \left(\frac{\pi_{12}}{\pi_{12}+\pi_{21}}\right)^f \left(\frac{\pi_{21}}{\pi_{12}+\pi_{21}}\right)^g \end{align}

二項分布の期待値と分散の公式より、 \begin{align} E \left(f\right)=\frac{M\pi_{12}}{\pi_{12}+\pi_{21}} \quad V \left(f\right)=\frac{M\pi_{12}\pi_{21}}{ \left(\pi_{12}+\pi_{21}\right)^2} \end{align} 二項分布の正規近似より、漸近的に、 \begin{align} f \sim \mathrm{N} \left[\frac{M\pi_{12}}{\pi_{12}+\pi_{21}},\frac{M\pi_{12}\pi_{21}}{ \left(\pi_{12}+\pi_{21}\right)^2}\right] \end{align} 線形変換の性質より、「発症あり・発症なし」の標本確率は漸近的に、 \begin{align} \frac{f}{M}=p_f \sim \mathrm{N} \left[\frac{\pi_{12}}{\pi_{12}+\pi_{21}},\frac{\pi_{12}\pi_{21}}{M \left(\pi_{12}+\pi_{21}\right)^2}\right] \end{align}

対称性の帰無仮説 $H_0:\pi_{12}=\pi_{21}=\pi$ のもとでは、 \begin{gather} \frac{\pi_{12}}{\pi_{12}+\pi_{21}}=\frac{\pi}{\pi+\pi}=\frac{1}{2}\\ \frac{\pi_{12}\pi_{21}}{ \left(\pi_{12}+\pi_{21}\right)^2}=\frac{\pi \cdot \pi}{ \left(\pi+\pi\right)^2}=\frac{1}{4} \end{gather} したがって、帰無仮説のもとで、 \begin{align} \frac{f}{M}=p_f \sim \mathrm{N} \left(\frac{1}{2},\frac{1}{4M}\right) \end{align} 帰無仮説のもとで、「発症あり・発症なし」の標本確率を標準化した値は、 \begin{gather} 2\sqrt M \left(\frac{f}{M}-\frac{1}{2}\right)=Z_M \sim \left(0,1\right) \end{gather} また、 \begin{align} Z_M&=2\sqrt M \left(\frac{2f-M}{2M}\right)\\ &=\frac{2f-M}{\sqrt M}\\ &=\frac{2f- \left(f+g\right)}{\sqrt{f+g}}\\ &=\frac{f-g}{\sqrt{f+g}} \end{align} これを2乗した値は、 \begin{gather} \frac{ \left(f-g\right)^2}{f+g}=\chi_M^2 \sim \chi^2 \left(1\right) \end{gather} $\blacksquare$

導出②:四項分布を用いる方法

導出

この考え方では、分割表に四項分布モデルを仮定し、標本確率ベクトル \begin{align} \boldsymbol{p}= \left(\begin{matrix}p_{11}\\p_{12}\\p_{21}\\p_{22}\\\end{matrix}\right) \end{align} が漸近的に、4変量正規分布 \begin{gather} \boldsymbol{p} \sim {\mathrm{N}}_4 \left(\boldsymbol{\pi},\boldsymbol{\Sigma}\right)\\ \boldsymbol{\Sigma}=\frac{1}{N} \left[\begin{matrix}\pi_{11} \left(1-\pi_{11}\right)&-\pi_{11}\pi_{12}&-\pi_{11}\pi_{21}&-\pi_{11}\pi_{22}\\-\pi_{12}\pi_{11}&\pi_{12} \left(1-\pi_{12}\right)&-\pi_{12}\pi_{21}&-\pi_{12}\pi_{22}\\-\pi_{21}\pi_{11}&-\pi_{21}\pi_{12}&\pi_{21} \left(1-\pi_{21}\right)&-\pi_{21}\pi_{22}\\-\pi_{22}\pi_{11}&-\pi_{22}\pi_{12}&-\pi_{22}\pi_{21}&\pi_{22} \left(1-\pi_{22}\right)\\\end{matrix}\right] \end{gather} に従うとする。 このとき、確率変数の差の分散の公式 $V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right)$ より、 \begin{align} V \left(p_{12}-p_{21}\right)&=V \left(p_{12}\right)+V \left(p_{21}\right)-2\mathrm{Cov} \left(p_{12},p_{21}\right)\\ &=\frac{\pi_{12} \left(1-\pi_{12}\right)}{N}+\frac{\pi_{21} \left(1-\pi_{21}\right)}{N}-2 \left(-\frac{\pi_{12}\pi_{11}}{N}\right)\\ &=\frac{\pi_{12}-\pi_{12}^2+\pi_{21}-\pi_{21}^2+2\pi_{12}\pi_{11}}{N}\\ &=\frac{ \left(\pi_{12}+\pi_{21}\right)- \left(\pi_{12}-\pi_{21}\right)^2}{N} \end{align}

帰無仮説 $H_0:\pi_{12}=\pi_{21}=\pi$ における標本比率の差の分散は、 \begin{align} V \left(p_{12}-p_{21}\right)&=\frac{ \left(\pi+\pi\right)- \left(\pi-\pi\right)^2}{N}\\ &=\frac{2\pi}{N} \end{align}

標本比率の差の分散の一致推定量は、 \begin{align} \hat{V} \left(p_{12}-p_{21}\right)=\frac{p_{12}+p_{21}}{N} \end{align} これを標準化した値は、 \begin{align} \frac{\sqrt N \left(p_{12}-p_{21}\right)}{\sqrt{p_{12}+p_{21}}}=Z_M \sim \left(0,1\right) \end{align} また、 \begin{align} Z_M&=\frac{N}{N} \cdot \frac{\sqrt N \left(p_{12}-p_{21}\right)}{\sqrt{p_{12}+p_{21}}}\\ &=\frac{N \left(p_{12}-p_{21}\right)}{\sqrt{N \left(p_{12}+p_{21}\right)}} \end{align} $Np_{12}=f,Np_{21}=g$ より、 \begin{align} Z_M=\frac{f-g}{\sqrt{f+g}} \end{align} これを2乗した値は、 \begin{gather} \frac{ \left(f-g\right)^2}{f+g}=\chi_M^2 \sim \chi^2 \left(1\right) \end{gather} $\blacksquare$

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.225-227
  • McNemar, Q. Note on the sampling error of the difference between correlated proportions or percentages. Psychometrika. 1947, 12(2), p.153-157, doi: 10.1007/BF02295996

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ