交絡は、研究を進めるうえで、適切な因果推論を妨げ、研究者を間違った結論に陥れる可能性がある非常に厄介な現象です。そのため、交絡の影響を取り除くための方法は、とても重要です。本稿では、そんな交絡に対処する方法のひとつであるマッチングについて、その概要と特徴を解説しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
マッチングで交絡を防止する原理
交絡は、本質的に「比較する群間で、交絡因子の分布が異なる」ことによって生じます。この点、マッチング matching は、両群での交絡因子の分布を等しくすることで、交絡を予防するという発想にもとづく方法といえます。
「対象者の限定」もまた、交絡因子のレベルを等しくして、その影響を取り除く方法ですが、「対象者の限定」では、交絡因子の可能性が疑われる1つ以上の因子について、単一の値あるいは限られた範囲の値に限定されてしまいます。これに対し、マッチングでは、対応するペアが存在する限り、交絡因子のレベルには制限がないため、その分、一般性が高い方法ということができます。
マッチングは、原理的にコホート研究とケース・コントロール研究のどちらでも使える方法ですが、後述するように、とりわけケース・コントロール研究でよく用いられる方法とされているため、以下ではケース・コントロール研究を想定します。
マッチングの方法
交絡因子と思われる共変量の値に応じたカテゴリーを設ける
マッチングを行う場合、まず、交絡因子と思われる共変量の値に応じたカテゴリーを設けます。この点、例えば、まったく同じ年齢でマッチングすれば、より効果的に交絡を予防することができ、「5歳区切りのカテゴリーでマッチングする」というように、マッチングの程度をゆるやかにするほど、年齢分布にわずかな違いが残る可能性が高くなります。しかし、より厳密にマッチングしようとする(例えば、まったく同じコレステロール値の人を見つける)と、その分、相手を見つけるための手間が増えてしまいます。
このため、性別や人種など、もともとカテゴリー変数である場合はもちろんのこと、年齢やコレステロール値などの連続型共変量である場合も、カテゴリー化したうえでマッチングを行うのが一般的とされています。
なお、マッチング対象とする因子は、1つだけでなく、複数を組み合わせることも可能です。例えば、年齢と性別をマッチング対象としたい場合は、「40-45歳・男性」、「46-50歳・男性」、「40-45歳・女性」、「46-50歳・女性」のようになります。このような場合、組み合わせる因子の数と水準が多くなるほど、マッチング相手を見つけにくくなります。
両群で共変量の分布が等しくなるようにサンプリングする
交絡因子の区分が決まったら、交絡因子の水準が等しくなるようにサンプリングします。そのための方法には、頻度マッチングと個別マッチングの2種類の方法があります。
頻度マッチング
頻度マッチング frequency matching は、関心のある因子(共変量)について、最初にケース群の分布を確かめ、次にその分布を複製するようなコントロール群を選ぶ方法で、マッチングされた集合 matched set を構築し、群(集団)としての分布を揃える方法です。
例えば、心筋梗塞とコーヒー飲用の関連を調べる場合、1日に10-20本喫煙するケースが20人いれば、同じ喫煙水準のコントロールを20人選び、非喫煙者がケースに10人いれば、10人の非喫煙者をコントロールとしてサンプリングします。こうして、ケース群とコントロール群の喫煙曝露量を等しくすることができます。
なお、頻度マッチングは、度数マッチングやクラス内マッチング within-class matching と呼ばれることもあります。
個別マッチング
個別マッチング individual matching は、ケース群のメンバーを1人ひとり見ていき、各ケースと交絡因子の水準が一致するコントロールを探す方法で、マッチングされたペア matched pair を構築し、個人レベルで分布を揃える方法です。
たとえば、心筋梗塞とコーヒー飲用の研究において喫煙水準でマッチングする場合を例に取れば、それぞれのケース(心筋梗塞患者)は、そのケースとほぼ同等の量(例:10-20本/日)だけ喫煙する(もしくは喫煙しない)コントロールとマッチングされます。それぞれのケースのコーヒー飲用は、そのケースにマッチングされたコントロールと比較されることになります。
なお、個別マッチングは、ペア・マッチング pair-wise matching と呼ばれることもあります。
サンプルサイズの比
頻度マッチングと個別マッチングのどちらの方法でも、結果としてマッチング因子に対して両群が同じ分布をもつこととなるため、交絡を予防することができます。
通常、サンプリングを行う際には、どちらの方法でも、ケースとコントロールを同数($1:1$ の比)サンプリングすれば十分ですが、根本的には、「両群の分布(≒群全体に対する各カテゴリーの構成割合)が等しく」なればいいので、1人のケースに対して、複数のコントロールを対応させる($1:n$ の比)ことも可能です。また、層内の各層のサンプルサイズ同士についても、同じにする必要はありません。
たとえば、ケースとコントロールの人数比を $1:2$ にする場合は、1日に10-20本喫煙するケースが20人いれば、同じ喫煙レベルのコントロールを40人選び、非喫煙者がケースに10人いれば、20人の非喫煙者をコントロールとしてサンプリングします。このようにしても、ケース群とコントロール群の群としての喫煙曝露量は等しくなるため、やはり交絡を予防できます。
マッチング研究の解析方法
マッチングしたデータを正しく分析するには、マッチングを前提とした特別な解析法、つまり、マッチングされたベア同士だけを比較し、マッチングされていない相手とは比較しない解析法が必要となります。これをマッチトペア分析 matched pair analysis といいます。マッチトペア分析では、まず、ケースとコントロールのペアを1単位としてカウントするため、コントロールが見つからないケースのデータは解析に使用できなくなります。
さらに、マッチトペア分析では、「不一致ペア」のみが実質的に解析に使用され、「一致ペア」は解析には貢献しません。不一致ペア discordant pair とは、曝露が異なるケースとコントロールのペアのことで、一致ペア cordant pair とは、曝露が同じケースとコントロールのペアのことです。具体的には、ケース・コントロールが「曝露あり・暴露なし」と「曝露なし・暴露あり」の組み合わせに該当するペアは「不一致ペア」、「曝露あり・暴露あり」と「曝露なし・暴露なし」の組み合わせは「一致ペア」となります。
こうしたことから、マッチング研究では、実際に集めたサンプルサイズよりも少ないサンプルで解析を行うことになります。マッチングされたデータにマッチングを考慮しない通常の解析を行うと、比較する2つのサンプルが独立という前提が成立しないため、結果が不正確となり、通常は、関連が弱まる方向にバイアスがかかります。
マッチングの利点
属性因子による交絡を防ぐ
マッチングによって、属性因子による交絡を防ぐことができます。属性因子 constitutional factor とは、年齢、性別、人種など、アウトカム(疾患)の発生には強い影響を持つものの、介入によって変化することがなく、また病因と疾患の因果連鎖の中に位置しない(=介在因子ではない)因子のことをいいます。
測定できない交絡因子の影響も除去できる
マッチングには、測定できない交絡因子の影響も除去できるという特別な利点があります。たとえば、兄弟(あるいは双子)同士でマッチングすれば、測定不可能なさまざまな遺伝的要因や、家庭的要因を取り除くことができ、また、研究に複数の医療施設が参加する場合には、各医療施設内でケースとコントロールをマッチングすれば、医療施設間に何らかの格差が存在しても、その影響を受けずに済みます。
推定の精度を高める
マッチングには、比較の精度(偶然に左右されにくく安定である度合)を高め、その結果、真の関連を検出する統計学的検出力を高める効果を期待できます。これは、マッチングによって交絡因子の各レベルにおけるケースとコントロールの割合が等しくなることに伴う効果で、利用できる対象者の数が限られている場合や、研究に多額の費用がかかる場合などには、重要な利点となります。
しかし、精度に及ぼすマッチングの効果はささやかなものであり、また、常に望ましい効果が期待できるわけでもありません。マッチングを行う主な理由は、交絡を除くためであって、精度を高める(=偶然誤差を減らす)効果は、副次的なものにすぎません。
便宜的マッチング
最後に、マッチングは、コントロールになり得る人がきわめて多いときに、その候補者を絞り込むためのサンプリング上の便法として用いられることもあります。たとえば、精巣胚細胞腫瘍とマリファナに関するケース・コントロール研究では、ケースである腫蕩患者に対し、腫瘍を発症していない、年齢の近い友人がコントロールとして用いられています。しかし、この方法は便利な反面、オーバーマッチング(後述)の危険が伴うことがあります。
マッチングの欠点
かなりの時間と費用がかかる
マッチングでは、それぞれの対象者にマッチした相手を探し出すために、かなりの時間と費用がかかります。たとえば、ケース・コントロール研究では、マッチングする項目が増えるほど、マッチする相手を探す範囲を広げなくてはならず、コントロールが見つからない場合には、その患者は、分析から除外しなければならなくなります。この場合、マッチングによる統計学的検出力の増加と、マッチングできない患者が分析から失われることの損失とを天秤にかけて、判断しなければなりません。
計画段階でやるかどうかを決めなければならない
マッチングは、サンプリングの手法であるため、それを行うかどうかは研究の最初に決めなければならず、しかもいったん決めると後で変更することはできません。そして、マッチングに用いた因子については、それがアウトカムに及ぼす影響を研究することはできなくなるという問題もあります。年齢や性別のような属性因子ではなく、予測因子とアウトカムの間の因果経路に介在する因子(介在因子)をマッチングに用いてしまうと、研究に重大な支障が生じることがあります。たとえば、心筋梗塞に対するアルコール摂取のリスクを調べたいと思っている研究者が、血清HDLコレステロールについてマッチングを行ったとすれば、その研究者はHDLコレステロールの増加を通じて得られるアルコールの有益な効果を見逃すことになってしまいます。同様の問題は、解析段階でも生じることがありますが、マッチングの段階でこうした間違いを犯してしまうと、取り返しがつきません。解析段階であれば、そうした誤差は単に適切な解析法に変えることによって、避けることができます。
オーバーマッチング:マッチングによる選択バイアス
ケース・コントロール研究におけるマッチングは、交絡を防ぐ有効な手段であり、これまでも多くのケース・コントロール研究でマッチングが行われてきました。しかし、それならすべての研究をマッチング研究でやればいいかというと、実はそうとも限りません。それは、マッチングすることによって、選択バイアスが生じてしまうことがあるからです。マッチングによる選択バイアスの例として、ロスマン(2013)$^\mathrm{(1)}$では次のような例が紹介されています。
今、ある街で地域住民の10%が、疾病リスクを10倍にする物質に曝露されているとします。ここで、男性は女性よりも疾病リスクが5倍であり、女性ではたった10%しか曝露を受けていないのに対し、男性では90%が曝露を受けています。人口は男性が100000人、女性が100000人とすると、この地域の1年間の疾病リスクは以下のようになります。男性と曝露集団で疾病リスクが高く、かつほとんどの男性が曝露を受けているため、ほとんどの症例は曝露した男性で生じています。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $4500$ | $85500$ | $90000$ |
非曝露群 $(\bar{E})$ | $50$ | $9950$ | $10000$ |
合計 | $4550$ | $95450$ | $100000$ |
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $100$ | $9900$ | $10000$ |
非曝露群 $(\bar{E})$ | $90$ | $89910$ | $90000$ |
合計 | $190$ | $99810$ | $100000$ |
調整なし周辺解析の場合
男性の疾病リスクが女性と比べてきわめて高く、非曝露集団の大多数が女性であるのに対し、曝露集団の大多数が男性であるため、曝露集団と非曝露集団間の男性割合の不均衡が曝露の影響と交絡する可能性が高くなります。実際、男女別の層を統合すると、以下のようになり、発症リスク比の推定値は32.9と、実際の値である10よりもずっと大きな値になります。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $4600$ | $95400$ | $100000$ |
非曝露群 $(\bar{E})$ | $140$ | $99860$ | $100000$ |
合計 | $4740$ | $195260$ | $200000$ |
\begin{gather} \mathrm{\widehat{RR}}=\frac{4600\times100000}{100000\times140}\cong32.9 \end{gather}
頻度マッチングしたコホート研究の場合
ここで、この住民を対象としたコホート研究を試み、性別で曝露群と非曝露群を頻度マッチングするとします。全曝露集団の10%の標本を曝露コホートとして無作為に抽出し、この10000人の曝露集団と10000人の非曝露集団をペアとなる人が同じ性別となるようにマッチングすると以下のようになります。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $450$ | $8550$ | $9000$ |
非曝露群 $(\bar{E})$ | $45$ | $8955$ | $9000$ |
合計 | $495$ | $17505$ | $18000$ |
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $10$ | $990$ | $1000$ |
非曝露群 $(\bar{E})$ | $1$ | $999$ | $1000$ |
合計 | $11$ | $1989$ | $2000$ |
性別でマッチングしたため、曝露集団と非曝露集団間の男性割合の不均衡はもはやみられません。この研究の粗データを使ってリスク比を推定すると、10と推定できます。つまり、マッチングによって、性別による交絡を防ぐことができたことになります。
発症あり $ \left(D\right)$ | 発症なし $(\bar{D})$ | 合計 | |
---|---|---|---|
曝露群 $ \left(E\right)$ | $460$ | $9540$ | $10000$ |
非曝露群 $(\bar{E})$ | $46$ | $9954$ | $10000$ |
合計 | $506$ | $19494$ | $20000$ |
\begin{gather} \mathrm{\widehat{RR}}=\frac{460\times10000}{10000\times46}=10 \end{gather}
頻度マッチングしたケース・コントロール研究の場合
しかし、性別による交絡を防ぐためにケース・コントロール研究でマッチングを利用した場合の状況は、それほど単純ではありません。
仮にこの地域で1年間に生じた全症例を対象に、ケース・コントロール研究を行ったとします。まず、全症例数は4740例です。次に、同じ地域から交絡を防ぐために性別で頻度マッチングさせた4740名のコントロール群を抽出します。理想的には、コントロール群は症例となるリスクをもつ全集団から抽出するべきですが、性別でマッチングする場合、4740症例のうち、4550例が男性、190例が女性という枠が与えられます。男性の90%と女性の10%が曝露されているため、男性コントロール群の $4550\times0.9=4095$ 例$^\mathrm{(i)}$と女性コントロール群の $190\times0.1=19$ 例が曝露されており、コントロール群のうち曝露されたものは計 $4095+19=4114$ 例となります。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $4600$ | $140$ | $4740$ |
コントロール群 $(\bar{E})$ | $4114$ | $626$ | $4740$ |
合計 | $8714$ | $766$ | $9480$ |
\begin{gather} \mathrm{\widehat{OR}}=\frac{4600\times626}{4114\times140}\cong5.00 \end{gather}
コホート研究とは異なり、ケース・コントロール研究でマッチングを行っても曝露オッズ比の推定値は10という正しい値にはなりません。この推定値は、全人口で交絡の影響を考慮せず求めた粗リスク比の $\mathrm{\widehat{RR}}\cong32.9$ という値とも一致しません。ケース・コントロール研究で得られるリスク比の推定値は5であり、実際の値より過大評価というよりも過小評価となります。
曝露効果が過小評価された原因
この結果は、実は選択バイアスによって生じています。性別にもとづいてコントロール群を選択したため、コントロール群のほとんどが男性となり、コントロール群の曝露分布がケース群の曝露分布に近づくようにシフトした結果、影響が過小評価されてしまったというわけです。
ケース・コントロール研究をデザインする際のカギは、「コントロール群を曝露状況とは無関係に選択すること」です。この原則が守られない場合、選択バイアスが生じてしまいます。今回の場合、性別が曝露状況と相関があったため、意図せずしてコントロールを曝露者から選択的に集めてしまい、結果、曝露の効果が薄まってしまったということになります。
一般的に、予測因子(への曝露状況)とは関連があるがアウトカムとは関連がない因子(つまり、交絡因子ではない因子)でマッチングを行うと、「コントロール群を曝露状況とは無関係に選択すること」という原則が破られ、その結果、選択バイアスが生じ、ケースとコントロールの間での予測因子の値が近づいてしまうという現象が起こります。このような現象をオーバーマッチング over matching といいます。
オーバーマッチングでは、マッチングを行うことで、コントロール群の曝露分布はもとの原集団の曝露分布を反映しなくなり、かわりに、マッチングで選択されたコントロール群の曝露分布は、ケース群の曝露の分布と近づく傾向があります。曝露とマッチング因子との間に完全な相関が認められる場合、コントロール群とケース群の曝露分布はまったく同じになります。この場合、実際には曝露の影響があるにもかかわらず、あたかも曝露の影響がないようにみえてしまいます。
オーバーマッチングへの対処法
オーバーマッチングが生じている場合でも、解析段階で対処できる場合があります。今回の場合、マッチングしたデータを、マッチング変数である性別で層化して、それぞれの層で曝露オッズ比を求めてみると、以下のようになります。
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $4500$ | $50$ | $4550$ |
コントロール群 $(\bar{E})$ | $4095$ | $455$ | $4550$ |
合計 | $8595$ | $505$ | $9100$ |
\begin{gather} \mathrm{{\widehat{OR}}_M}=\frac{4500\times455}{4095\times50}=10 \end{gather}
曝露あり $ \left(D\right)$ | 曝露なし $(\bar{D})$ | 合計 | |
---|---|---|---|
ケース群 $ \left(E\right)$ | $100$ | $90$ | $190$ |
コントロール群 $(\bar{E})$ | $19$ | $171$ | $190$ |
合計 | $119$ | $261$ | $380$ |
\begin{gather} \mathrm{{\widehat{OR}}_F}=\frac{100\times171}{19\times90}=10 \end{gather}
層別した結果、男女双方において、このケース・コントロール研究のデータから曝露オッズ比=10という正しい推定値が得られています。
このように、ケース・コントロール研究でマッチングによって生じた選択バイアスは、マッチング因子による層別解析などの適切な分析方法によって除外できることがあります。多変量解析のようにマッチング因子を調整するような分析方法も、選択バイアスを除外するのに用いることができます。
研究デザインによるマッチングの位置づけの違い
コホート研究
コホート研究では、曝露群と非曝露群を抽出する際、無作為抽出の原則が守られていれば、背景因子が自然に揃うことが期待できるので、リスク比を求めるために必ずしもマッチングを行わなくてもよいとされています。あえて行うとすれば、上述したような、推定精度の向上によって、より良い推定値や曝露効果の評価が行えるようになることを期待してマッチングを行います。
本稿で挙げた架空の町での例のように、コホート研究でマッチングを行った場合、層化などの特別な解析方法を用いなくても、正しい推定値が直接得られることがあります。ただしこれは、対象者の脱落(追跡不能や競合リスクの発生)が起こらなかった場合にのみ当てはまります。
ペア・マッチングの場合、データの解析はマッチングされたペアを1単位として行うため、片方が脱落してしまうと、そのパートナーのデータは無事採取できたとしても、解析には使うことができず、サンプルサイズの減少にともない、推定の精度が減少します。
頻度マッチングの場合は、1人が脱落しても対応するパートナーはいないため、脱落が少数であれば大勢に影響はありませんが、群間で脱落の速度や確率が異なる場合、研究開始時には各群で等しかったマッチング因子の分布に差が出始め、最終的にはやはり交絡を生じさせるだけの差になってしまうということも起こり得ます。
こうした事情もあり、コホート研究ではマッチングはあまり行われず、解析で制御することが一般的とされています。
ケース・コントロール研究
ケース・コントロール研究では、マッチングは交絡の予防に効果的ではありますが、同時にオーバーマッチングの問題により、新たな選択バイアスが発生する危険性もあります。上述の例は頻度マッチングの場合でしたが、個別マッチングの場合も、同様にオーバーマッチングが問題となることがあります。
例えば、喫煙と肺がんの関係を調べる際、便宜的マッチングとしてケースの友人を紹介してもらうと、「趣味・嗜好」といった因子でマッチングされると考えられます。このとき、「喫煙者は喫煙者の友人しかいない、非喫煙者は非喫煙者の友人しかいない」という極端な関係があるとすると、必ず「喫煙者・喫煙者」、「非喫煙者・非喫煙者」の組み合わせとなり、不一致ベアはなしということになります。マッチトペア分析では曝露レベルが等しいケースとコントロールのペアは解析に貢献しないため、こうした現象が起こると、ケース・コントロール研究の統計学的検出力を減少させ、真の関連を見えにくくしてしまいます。
オーバーマッチングによって生じた選択バイアスは、解析段階での対処によって取り除くことができますが、マッチングを行わなかった場合でも、やはり解析段階での対処によって交絡を取り除く必要があるため、いずれにしても、マッチングだけで完全に交絡を予防することは難しく、解析段階での調整が必要となります。
また、複数の変数や変数の組合せでマッチングを行うことで、各層内のサンプルサイズが小さくなる可能性があることも課題となります。多くの変数でマッチングを行った場合、珍しいマッチング因子の値の組合せが生じる可能性があります。この場合、層別解析における層のそれぞれで、マッチングしたコントロール群1人以上に対しケースが1例しかいないことになる可能性があります。このように層内の人数が少ない場合、1人のケースとマッチングされた全コントロールの曝露状態がかなり高い確率で同じ(すなわち、全員が曝露を受けた状態か全員が曝露を受けていない状態)になります。曝露状態が層内で変わらない場合は、この層は解析に何の情報も提供せず、解析の際には使われないため、効率性が損なわれることになります。
このような潜在的な問題があるため、ケース・コントロール研究でマッチングを行う意義は、〔…〕ときにはあるだろうが、たいていはない。〔…〕ケース・コントロール研究では、例外を除いてマッチングは避けたほうがよい
$^\mathrm{(2)}$とする意見もあります。
ただ、さまざまな遺伝的要因や家庭的要因など測定不可能な交絡因子の影響を取り除く方法として、マッチングはやはり有効な手段となります。
参考文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.183-189, p.204-206, p.271-272
- スティーブン・ハリー, スティーブン・カミングス ほか 著, 木原 雅子, 木原 正博 訳. 医学的研究のデザイン:研究の質を高める疫学的アプローチ 第4版. メディカル・サイエンス・インターナショナル, 2014, p.142-145
- 中村 好一 著. 基礎から学ぶ楽しい疫学 第4版. 医学書院, 2020, p.109
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.221-252
引用文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.183-189
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.188
脚注
- この点、厳密には、以下のように考えられます。
男性コントロール群全体 \begin{gather} M_{\bar{D}}=+M_{\bar{D}\bar{E}}=85500+9950=95450 \end{gather} 男性コントロール群全体のうち、曝露者が占める割合 \begin{gather} p=\frac{M_{\bar{D}\bar{E}}}{M_{\bar{D}}}=\frac{85500}{95450}=0.896=89.6\% \end{gather} これにともない、男性コントロール群の曝露者は、 \begin{gather} 4550\times\frac{85500}{95450}\cong4075 \end{gather} ただ、大勢に影響はないので、計算がしやすい90%としていると思われます。
0 件のコメント:
コメントを投稿