交絡への対処法②:層別解析

公開日:

【2022年11月2週】 【A000】生物統計学 【A041】バイアス・交絡 【A062】層別解析

この記事をシェアする
  • B!
サムネイル画像

医学・疫学研究を実施するにあたり、交絡への対策は非常に重要とされていますが、そうした交絡への対策のひとつに層別解析という手法があります。層別解析には、大別して標準化とプール化の2種類がありますが、本稿では、それらのうち、プール化の方法として特に有名なマンテル・ヘンツェルの方法について解説しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

周辺解析と粗効果

交絡とは、ある危険因子とアウトカムの関係を評価する際、「第3の因子の影響によって、見かけ上、関連があるように(もしくは、ないように)見えてしまう現象」のことで、適切な因果推論を妨げる厄介な現象です。ここで、交絡によって観測が歪められる例をもう一度見てみましょう。

例えば、コーヒーの摂取と心筋梗塞の関係についてケース・コントロール研究で調べた結果、次のような分割表が得られたとしましょう。

表1 コーヒーの摂取と心筋梗塞の関係(仮想例)
曝露あり
(E)
曝露なし
(E¯)
合計
ケース群
(D)
90 60 150
コントロール群
(D¯)
60 90 150
合計 150 150 300

このとき、曝露オッズ比は、 OR^=90×9060×60=2.25 となり、両者の間には関係があるように見えます。

このように、単層の分割表(曝露・発症状況のみにもとづいた単純な区分け)のデータをそのまま解析すること周辺解析 marginal analysis、あるいは調整なし解析 unadjusted analysis といい、周辺解析によって得られた曝露効果(リスク比やオッズ比など)のことを粗効果 crude effect といいます(i)。そして、こうした粗効果は、交絡因子の影響を受けていることがあるため、交絡の影響を除去するような解析が必要となるということでした。

サブグループ解析

交絡の影響を除去する方法としてまず考えられるのは、交絡因子となり得る因子(年齢や性別など)によって両群を更に区分けし(サブグループを作る)、新たにできた層ごとに曝露効果を推定するという方法です。例えば、喫煙状況で層別し、それぞれでオッズ比を算出するということです。先ほどの例を喫煙状況で層別すると、

表2-1 コーヒーの摂取と心筋梗塞の関係(喫煙者)
曝露あり
(E)
曝露なし
(E¯)
合計
ケース群
(D)
80 40 120
コントロール群
(D¯)
20 10 30
合計 100 50 150
表2-2 コーヒーの摂取と心筋梗塞の関係(非喫煙者)
曝露あり
(E)
曝露なし
(E¯)
合計
ケース群
(D)
10 20 30
コントロール群
(D¯)
40 80 120
合計 50 100 150

このとき、曝露オッズ比は、 OR^S=80×1040×20=1.0OR^NS=10×8020×40=1.0 となり、両者の間には関係がないということになりました。

このような方法をサブグループ解析 subgroup analysis条件付き層内解析 conditional stratified analysis といいます。この方法は、基本的に研究デザインの段階で行う「対象者の限定」を解析段階で事後的に行っていると言うこともできます。

サブグループ解析は、交絡因子の影響を除去するうえでの単純かつ確実な方法で、因子間の交互作用の影響を調べることができるなどの長所がある方法です。

いっぽうで、層化(サブグループ化)することで各層のサンプルサイズが小さくなり、検出力が低下してしまう、検定の多重性の問題により、第1種の過誤確率が増大してしまう、因子間の交互作用の影響も取り除いた、関心のある因子単独の曝露効果が分からないなどの短所もあります。

層別解析

こうしたことから、交絡の影響を取り除き、かつ、すべての層に通底するような因子単独の効果を把握できるような解析方法が必要とされました。この要望に応えたのが層別解析と呼ばれる手法です。

層別解析 stratified analysis とは、サブグループごとの結果を統合して、1つの曝露効果を推定するための方法で、基本的な方法として「プール化」と「標準化」の2通りの方法があります。

標準化は、端的にいうと、「曝露グループが曝露を受けなかった場合」を予想する方法です。プール化とは異なり、「すべての層にわたって曝露効果が同じ値である」という仮定は必要とせず、効果の指標の修飾や交互作用が存在している場合でも、妥当な方法と言えます。

これに対し、プール化はすべての層にわたって曝露効果が同じ値であると仮定し、層別の推定値を加重平均して、すべての層に共通する共通効果を求める方法です。この仮定が成り立つ場合、プール化は標準化よりも推定の精度や検定における検出力が優れた方法になります。本稿では、このプール化の代表的な方法であるマンテル・ヘンツェルの方法について、後で詳しく見ていきます。

層別解析で交絡因子の影響が取り除かれる原理

層別解析は、「交絡因子の影響を取り除いた、その因子単独の曝露効果を推定するための方法」ということができますが、交絡は、関心のある因子の曝露効果と交絡変数の効果が混ざることで発生します。例えば、ある病気の男女差を調べようと思った際、男性は若年者、女性は高齢者が多かった場合、実質的に、「若年者」と「高齢者」の比較になってしまうことによって、交絡が発生します。

この点、層化は、事後的に行う「対象者の限定」であり、「対象者の限定」の原理にもとづいて、交絡因子の影響が除去された曝露効果の指標(リスク比やオッズ比など)が得られます。その結果、複数の曝露効果の指標(層別の推定値 stratum-specific estimate)が出てきますが、層別解析は、「それらを1つに統合することで、関心のある因子単独の曝露効果を分かりやすいかたちで把握すること」を試みているということができます。

この話の中の「1つに統合する方法」は、基本的に「加重平均を求める」ということになりますが、その際の重みのつけ方に何種類かの考え方があります。

プール化

層別解析におけるプール化 pooling とは、因子同士の交互作用などはなく、因子の曝露効果は、すべての層を通じて同じであるという仮定(効果均一性の前提 assumption of uniformity of effect)にもとづき、層別の推定値の加重平均を求める方法です。プール化では、マンテル・ヘンツェルの方法(1,2)が特に有名で、最も情報を与える層、すなわち最もデータをもつ層が、最も重みを得るように重み付けされるという考えによる重みのつけ方を採用しています。

以下、研究デザインや曝露効果の指標ごとに、マンテル・ヘンツェルの方法による推定値や推定値の分散の公式を紹介します。

マンテル・ヘンツェル推定量

ここでは、収集したデータが交絡因子と考えている共変量の値によって、K 個の層に層化することができるとします。

有病率・発生割合データのコホート研究

発生リスク差

RD^MH=k=1Kakn0kbkn1kNkk=1Kn0kn1kNkV(RD^MH)=k=1K[(n0kn1kNk)2{akckn1k2(n1k1)+bkdkn0k2(n0k1)}](k=1Kn0kn1kNk)2

発生リスク比

RR^MH=k=1Kakn0kNkk=1Kbkn1kNkV(logRR^MH)=k=1K(n0kn1km1kNk2akbkNk)(k=1Kakn0kNk)(k=1Kbkn1kNk)

発生率テータのコホート研究

発生率差

IRD^MH=k=1KakT0kbkT1kTkk=1KT0kT1kTkV(IRD^MH)=k=1K[(T0kT1kTk)2(akT1k2+bkT0k2)](k=1KT0kT1kTk)2

発生率比

IRR^MH=k=1KakT0kTkk=1KbkT1kTkV(logIRR^MH)=k=1K(m1kT0kT1kTk2)(k=1KakT0kTk)(k=1KbkT1kTk)

ケース・コントロール研究

曝露オッズ比

OR^MH=k=1KakdkNkk=1KbkckNkV(logOR^MH)=S32S12+S52S1S2+S42S22 ただし、 S1=k=1KakdkNkS2=k=1KbkckNkS3=k=1Kakdk(ak+dk)Nk2S4=k=1Kbkck(bk+ck)Nk2S5=k=1K(ak+dk)bkck+(bk+ck)akdkNk2 これは、Robins et al.(1986)(3,4)によるものです。

コクラン・マンテル・ヘンツェル検定

共通の曝露効果については、点推定や区間推定を行うだけでなく、統計学的検定を行うこともできます。その際に使用される検定統計量は、マンテル・ヘンツェル(1,2)によるものとコクラン(5)によるものがありますが、どちらも漸近的には等しい値になるため、しばしば、まとめてコクラン・マンテル・ヘンツェル検定 Cochran–Mantel–Haenszel test と呼ばれます。

具体的な検定統計量の公式は、以下のとおりですが、有病率・発生割合データとケース・コントロール研究のデータについては、以下のように、オッズ比を用いて帰無仮説と対立仮説の評価を行います。

帰無仮説を 全層共通のオッズ比が1である
⇔すべての層で曝露群と非曝露群の発症確率が等しい
H0:π1k=π0kφk=1 対立仮説を 1ではない全層共通のオッズ比が存在する
⇔各層の曝露群と非曝露群の発症確率は等しくない
H1:π1kπ0kφk=φ(1) とする。

ケース・コントロール研究の場合は、それぞれ、「曝露群→ケース群」と「非曝露群→コントロール群」、「発症確率→曝露確率」となります。

マンテル・ヘンツェル検定

有病率・発生割合データとケース・コントロール研究

χMH2=[k=1K{akn1km1kNk}]2k=1K[m1km0kn1kn0kNk2(Nk1)]

発生率データ

χMH2=[k=1K{akT1km1kTk}]2k=1K[m1kT1kT0kTk2]

コクラン検定

χC2=[k=1K{akn1km1kNk}]2k=1K[n1kn0km1km0kNk3]

マンテル・ヘンツェル推定量の例題

では、実際に例題(6)でマンテル・ヘンツェル推定量を算出してみましょう。

周辺解析

表3-1 周辺解析
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
30 170 200
非曝露群
(E¯)
20 180 200
合計 50 350 400

周辺解析による発生割合は、 π^1=30200=0.15π^0=20200=0.2

したがって、発生リスク差と発生リスク比はそれぞれ RD^=0.20.15=0.05RR^=0.20.151.33

層別解析

表3-2 第1層(55歳未満)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
8 92 100
非曝露群
(E¯)
5 115 120
合計 13 207 220
表3-3 第2層(55歳以上)
発症あり
(D)
発症なし
(D¯)
合計
曝露群
(E)
20 80 100
非曝露群
(E¯)
15 65 80
合計 35 145 180

層別解析によるそれぞれの発生割合は、 π^11=8100=0.080π^01=51200.042π^12=20100=0.200π^02=15800.188

したがって、発生リスク差と発生リスク比はそれぞれ RD^1=0.0800.042=0.038RR^1=0.0800.042=1.92 RD^2=0.200.188=0.013RR^2=0.200.1881.07

発生リスク差のマンテル・ヘンツェル推定量は、 RD^MH=81205100220+208015100180100120220+10080180=2.091+0.55654.55+44.44=0.027 分散・標準誤差の推定量は、 V(RD^MH)={(100120220)2(89210010099+5115120120119)}+{(10080180)2(208010010099+1565808079)}(100120220+10080180)2=3.210+7.002(54.55+44.44)2=0.00104S.E.(RD^MH)=0.032 95% 信頼区間は、 0.027±0.0321.96=0.027±0.063=0.0370.09

発生リスク比のマンテル・ヘンツェル推定量は、 RR^MH=8120220+20801805100220+15100180=4.36+8.892.27+8.33=1.25 対数リスク比の分散・標準誤差の推定量は、 V(logRR^MH)=(1310012022022085180)+(35100801801802015180)(8120220+2080180)+(5100220+15100180)=3.04+6.9813.25+10.61=0.071S.E.(logRR^MH)=0.267 対数リスク比の 95% 信頼区間は、 log1.25±0.2671.96=0.223±0.523=0.30.746 したがって、リスク比の 95% 信頼区間は、 e0.3e0.746=0.742.11

層別解析の長所

柔軟にさまざまな検証ができる

解析段階での交絡調整の方法には、層別解析の他に多変量解析がありますが、多変量解析を人の手で行うことは難しく、ほとんどの場合、統計パッケージの力を必要とします。統計パッケージの利用は非常に便利ではありますが、しばしば結果の算出過程がブラックボックス化されていて、何らかの間違いがあったとしても、それを検証することが難しい場合が少なくありません。

この点、層別解析は比較的結果の導出方法が簡単で、やろうと思えば、電卓や表計算ソフトなどでも解析を行うことができます。また、層別解析には、最初にどれが予測因子でどれが交絡因子かを固定する必要がなく、自由に入れ替えることができるという利点もあります。そのため、まず、さまざまな因子で層化してみて、交絡因子となり得る因子の分布が偏っていないかを確認したり、ある因子で層化した分析と層化していない分析を比較し、結果に差が出るかどうかを確認することで交絡の有無を判別することが推奨されています。

また、層別解析ではほとんど前提を必要としないので、結果にバイアスが生じる可能性が少ない方法であるともされています。

層別解析の短所

コントロールできる因子の数が限られる

層別解析の主な短所は、1度にコントロールできる因子の数が限られることです。たとえば、年齢、性格、最高血圧、血清コレステロール値、喫煙歴の5因子すべてを用いて層化しようとすると、それぞれの因子の層数がたとえ3であっても、全層数は 35=243 にもなってしまいます。これでは、ケースやコントロールが0という層も出てくることになり、これらの層は解析に使用できなくなってしまいます。

残差交絡

各層に十分な数の対象者を確保するために、因子の層区分を2つだけとすることがよくありますが、この場合、層の幅が広すぎると、交絡の影響を十分に除去できないおそれがあります。たとえば、コーヒーの摂取量と心筋梗塞の関係を調べている時、年齢を50歳未満と50歳以上の2層にしか分けなかったとき、もし、それぞれの層の中で、年齢の高い人ほどコーヒー飲用量が多く、しかも心筋梗塞のリスクも高いとすると、コーヒーと心筋梗塞との関係には、なお、年齢の交絡が残っていることになります。これは、いわば「層内の交絡」といえる現象で、このような層内の交絡のことを残差交絡 residual confunding といいます。

このような残差交絡を避けるためにはより多くの層にデータを区切って、できれば上限のない層(たとえば55歳以上など)は避けるのが望ましいとされていますが、いっぽうで、あまりに細かく層化しすぎると不合理にデータが引き伸ばされ、セル内の事象の頻度は小さくなり不正確な結果を導く可能性があるため、適切な区分を設けることためには、試行錯誤の中で、「交絡の除去」と「統合した推定量の推定精度」とのバランスを取ることが必要となります。

参考文献

  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.248-262, p.268-269
  • 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック 新版. 朝倉書店, 2018, p.514-517
  • 丹後 俊郎, 小西 貞則 編集. 医学統計学の事典 新装版. 朝倉書店, 2018, p.99-100
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.135-139
  • 福富 和夫. マンテル・ヘンツェルの検定. 日本循環器管理研究協議会雑誌. 1989, 24(2), p.104-105, doi: 10.11381/jjcdp1974.24.104
  • 佐藤 俊哉, 高木 廣文, 柳川 堯, 柳本 武美. Mantel‐Haenszelの方法による複数の2×2表の要約. 統計数理. 1998, 46(1), p.153-177, http://hdl.handle.net/10787/316

引用文献

  1. Mantel, N. & Haenszel, W.. Statistical Aspects of the Analysis of Data From Retrospective Studies of Disease. Journal of the National Cancer Institute. 1959, 22(4), p.719-748, doi: 10.1093/jnci/22.4.719
  2. Mantel, N.. Chi-square tests with one degree of freedom: Extensions of the Mantel-Haenszel procedure. Journal of the American Statistical Association. 1963, 58, p.690-700, doi: 10.2307/2282717
  3. Robins, J., Breslow, N. & Greenland, S.. Estimators of the Mantel-Haenszel variance consistent in both sparse data and large-strata limiting models. Biometrics. 1986, 42(2), p.311-323, doi: 10.2307/2531052
  4. Robins, J., Greenland, S. & Breslow, N.. A general estimator for the variance of the Mantel-Haenszel odds ratio. Am J Epidemiol. 1986, 124(5), p.719-723, doi: 10.1093/oxfordjournals.aje.a114447
  5. Cochran, W.G.. Some Methods for Strengthening the Common χ2 Tests. Biometrics. 1954;10(4):417-451, doi: https://doi.org/10.2307/3001616
  6. ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.250-252

脚注

  1. 「粗効果」は総称で、実際には「粗+指標名」で表現されます。例えば、求めたものがリスク比なら「粗リスク比」、オッズ比なら「粗オッズ比」となります。

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ