因果的効果と反実仮想モデル

公開日: 更新日:

【2022年10月3週】 【A000】生物統計学 【A030】因果推論

この記事をシェアする
  • B!
サムネイル画像

曝露(介入)とアウトカムの関係を問題とする仮説検証的な医学・疫学研究では、観測されたデータにもとづく因果推論が行われます。そのために、無作為化比較試験などの実験デザインやさまざまな統計解析手法が開発されていますが、本稿では、そうした因果推論の基礎である因果的効果と反実仮想モデルについて解説しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

因果関係とは?

さまざまある医学・疫学研究のうち、「原因と結果の関連」、「治療や予防指導の効果・有効性」に関する研究では、「喫煙などの『危険因子』と肺がんなどの『疾病』の関係」や「ある疾病に対する薬の効果」が問題となります。これらは、「喫煙は肺がんの原因となっているか?」、「薬の摂取は、疾病が治癒したことの原因になっているか?」といいかえることができます。こうした、原因とそれによって生ずる結果との関係は、因果関係 causal relationship と呼ばれています。

因果関係は、原因と結果が1対1の関係にある場合は、話が単純です。例えば、フグ毒による死亡事故はフグの毒を摂取しない限り起こり得ず、フグを食べなければ「フグ毒による死亡」という結果は生じません。

医学・疫学研究における因果的効果

しかし、ヒトの健康を考える場合、こうした単純な因果関係はむしろ例外的といえます。例えば、「肺がん」という結果を考える場合、「喫煙」はたしかに危険因子となり得ますが、そのほかにも、「鉱山での採掘やトンネル工事に長年携わっている中で、粉塵を吸い込み続けてきた」、「交通量の多い道の沿線に住んでいるため、排気ガスを吸い込む機会が多かった」、「ストレスが多く、運動不足になりがちで、不規則な生活を送ってきた」といったことも原因になり得る因子でしょう。これは、複数の原因によって、1つの結果が生じるという場合です。

また、「喫煙」という原因を考える場合、引き起こされる結果は「肺がん」に限らず、「胃がん」や「心筋梗塞」、「脳卒中」なども喫煙によって引き起こされるかもしれません。これは、1つの原因で複数の結果が生じるという場合です。

例えば、肺がん患者数人にインタビューしたところ、Aさんは「タバコだけはやめられず1日1箱吸っていたが、それ以外は健康的な生活を送っていた」ということが分かり、Bさんは「トンネル工事に長年携わってきた。タバコは吸うには吸うが、1日に1本くらい」ということが分かりました。いっぽう、Aさんと同じくらいタバコを吸う人が、70歳を過ぎても、風邪ひとつ引かない生活を送っているという例も耳にします。こうしたことを考えると、個人ひとりひとりを対象にして「喫煙」が「肺がん」の原因であると断言することは、意外に難しい作業であることが分かります。

EBMを考える際、最終的には個人ひとりひとりに対して、最善な行動や治療方法を提案することが必要となります。しかし、最初から個人に焦点を合わせてしまうと、個人差ゆえに、例えば、「この人はタバコを吸っても大丈夫かどうか」という疑問について、結論が出せなくなってしまいます。もし仮にタイムマシンが実現し、「そのままタバコを吸い続けた場合の未来」を見ることができれば、「あなたはタバコを吸い続けても肺がんにはなっていないので、大丈夫そうです」と言えますが、実際にはそんなことはできません。

個人にとって原因Aが結果Bを引き起こすかの予測が困難である場合、次善の策として、「集団としてみた場合、どれくらいの頻度で、原因Aが結果Bを引き起こしているか」を考えることができます。

例えば、「喫煙者が肺がんを発症する確率は15%、非喫煙者の場合は5%」ということが分かれば、一般論にはなりますが、「喫煙すると肺がんのリスクが高まるので、止めておいた方が無難でしょう」という判断なり意思決定なりをすることができるようになります。医療の理論的な土台を形成する医学や疫学は、このような「集団全体を見たときの一般論」について考え、医療の実践段階で、その一般論が対象としている個人に当てはまるかどうかを検証するという役割分担をしているということです。

因果推論

医学・疫学研究では、原因と結果の関係が複雑なため、例えば、「『喫煙」』は『肺がん』の絶対的で唯一の原因ではないにせよ、原因のひとつにはなり得るのではないか」という問題を考え、その命題の真偽や確からしさの度合いをデータにもとづいて判断します。このように、観測された事実にもとづき、ある危険因子と疾病の因果関係について推論すること因果推論 causal inference といいます。

科学における伝統的な因果推論のプロセス

因果推論は、医学・疫学研究の分野だけで行われるわけではなく、むしろ、ずっと昔から科学哲学のテーマとなってきました。その中で伝統的・代表的な方法に演繹法と帰納法という方法があります。

演繹法

演繹法 deduction とは、一般的・普遍的な前提から個別の現象を説明することです。医学関連の例として、例えば「四体液説にもとづく瀉血」が挙げられます。四体液説とは、古代インドや古代ギリシャ医学において信じられていた考え方で、「人体には、『血液』、『粘液』、『黄胆汁』、『黒胆汁』の4種類の体液が流れており、その調和によって身体と精神の健康が保たれ、バランスが崩れると病気になる」という考え方のことです。この普遍的な理論にもとづき、「病気=体液のバランスが崩れているときには、瀉血(血液を外部に排出させること)によって体液のバランスを取り戻せば、健康を回復できる」と考えるのが演繹にもとづく推論にあたります。現代でいえば、ある薬が体内で作用し、対象となる疾病が治るまでの作用機序、あるいは病原菌が体内に侵入し、症状を発生させるまでの発生メカニズムを解明することで、原因に対する直接的なアプローチを考えることが演繹的な治療の実践といえます。

演繹法は、もともと数学的命題の妥当性を証明するために用いられてきた方法です。この方法は、限定された定義群と公理群から始まり、方法の妥当性を保証する論理法則を適用することから、自己完結的であるため、批判の余地のない結論を引き出すことを可能にしました。しかし、実証的科学ではそうはいかず、定義群と公理群は「絶対的に正しいもの」とすることができますが、四体液説はあくまでもひとつの理論にすぎず、「絶対的に正しいもの」ではありません。それゆえに、真偽が確認できていない誤った前提を用いると、その帰結として得られる因果推論も正しくないということになってしまいます。

帰納法

帰納法 induction とは、個別の現象から一般的・普遍的な理論を導き出すことです。例えば、「ある地方に伝わる秘伝の薬を飲んだところ、ある疾病が治ったという人が続出したため、その秘伝薬はその疾病に効果があるのではないか」と推論するという場合がこれに該当します。

帰納法は、フランシス・ベーコン Francis Bacon などの初期の近代実証主義者たちによって生み出された方法です。帰納的方法は自然の観察から始まり、観察の結果があるパターンに適合する限り、「自然についてより普遍的な考えを誘導した」とみなされます。観察を強調する帰納法は、中世のスコラ哲学を特徴づけた信仰と権威に訴えるやり方に比べて、重要な進歩ではありましたが、次第にその妥当性に疑問が呈されるようにもなりました。最も鋭い批判は懐疑論的哲学者のデイビッド・ヒューム David Hume の発したもので、「帰納法は論理的力をもたない。むしろそれは、過去に観察したことは将来も起こり続けるという仮定と同じにすぎない」という指摘でした。

最も典型的な例として、「すべてのカラスは黒い」という命題の証明を考えることができます。あなたは身の回りにいるカラスが、すべて黒いことを確認します。しかし、それはあくまでも「自分の身の回りにいたカラス」であって、「すべてのカラス」ではありません。自分が行けないような場所のカラスや、これから生まれてくるカラスもすべて観測しなければ、論理的に「すべてのカラスは黒い」という命題を証明できたことにはならず、これからあなたが何千、何万のカラスに遭遇し、そのすべてが黒かったとしても、「命題の正しさを推論するうえで有利な証拠」を積み重ねているにすぎないのです。そして、たった1羽でも「白いカラス」が観測されれば、たちまち、その命題の正しさは崩れてしまいます。

こうしたことから、演繹や帰納によって因果関係を論理的にはっきりさせるのは難しく、別のアプローチが必要となります。現在では、疫学研究の手法を応用した因果推論が広まっており、相対リスクなどの指標によって、曝露や介入とアウトカム(疾病の発症や疾病の治癒など)の因果関係が推論されています。

関連と因果関係

一般的に、ある2つの事象の関係を考える際、因果関係と似た概念に「関連」というものがあります。関連とは、ある事柄と他の事柄との間につながりがあることと定義されますが、確率論や統計学では、「独立性」や「相関」などの概念を用いて、「関連」を考えることができます。

確率論では、事象Bが発生したか否かによって、事象Aの起こりやすさが変わらないとき、事象Aと事象Bは独立であると表現します。例えば、ある男性とある女性が、それぞれ1回ずつコインを投げるとき、男性の投げたコインが表である確率は $\frac{1}{2}$、女性の投げたコインが表である確率も $\frac{1}{2}$ です。このとき、「コインを投げる人の性別」によって「表の出やすさ」が変わるわけではないので、「性別」と「表裏」は独立であり、同時に、両者の間には「関連(特別な関係)がない」ということになります。

いっぽう、例えば「子宮がん」と「性別」の関係について考えてみましょう。まず、男性が子宮がんになることはありません(発症確率は0%)。それに対して、女性の場合は、一定の確率で子宮がんを発症することがあります(発症確率は0%より大きい)。この場合、「性別」によって、「子宮がんの発症のしやすさ」が異なるので、「性別」と「子宮がんの発症」は独立ではなく、両者の間には「関連(特別な関係)がある」ということになります。

しかし、「事象Aと事象Bの間に『関連』があること」と「事象Aと事象Bの間に『因果関係』があること」は同義ではありません。例えば、身長が高い人は、その分身体についている筋肉の量が増えるので体重も重くなり、そうした意味で「身長」と「体重」の間には「関連」があるといえるでしょう。しかし、身長が違っても体重が同じ人たちが存在するので、「身長が高いから体重が重い」という関係は一概には成り立ちません。また同時に、「体重(≒脂肪)が増えたら身長が伸びる」ということもないため、「体重が重いから身長が高い」という関係も成り立たちません。それゆえに、両者に「因果関係」があるということにはなりません。

また、「運動不足」と「肥満」という関係について考えてみましょう。この場合、「運動不足だから肥満になる」という関係は成り立ちそうです。しかし、「肥満だから動くのが億劫になり、運動不足になる」という関係も成り立ちます。こうした場合、「運動不足」が「肥満」の原因なのか、それとも「肥満」が「運動不足」の原因なのかは判然とはせず、「関連」はあるにしても、どちらの方向に「因果関係」があるかがよく分かりません。

「性別」と「コインの表裏」のように、「関連」がなければ、そこに「因果関係」を考えることはできません。それゆえに、関連は因果関係が成り立つうえでの必要条件であるということはできます。しかし、「身長」と「体重」、「肥満」が「運動不足」の例のように、関連は因果関係が成り立つための十分条件ではないと考えることができます。

ヒルの基準

確率論や統計学では、「関連」の有無は、「相関」があるかないかによって、ある程度判断することができます。曝露と疾病発生の間に関連が認められた場合、それが因果関係であるのかないのかの判断は、最終的には、種々の状況を勘案して総合的に行う必要があります。

判断を恣意的に行わないために、また、判断の妥当性を示すために、種々の要件がこれまで提唱されてきました。現在、最も広く知られているのは、1964年のアメリカの公衆衛生総監 Surgeon General による喫煙と肺がんに関するレポートをもとに提唱されたヒルの基準$^\mathrm{(1)}$と呼ばれるものです。この中では、時間的関係を必須条件として、因果関係の確からしさを補強する要件として、関連の一致性、強固性、特異性、整合性、量反応関係、生物学的妥当性、実験が取り上げられています。

疫学の大家、ケネス・ロスマンは、ヒルの基準についてヒルはこれらの基準を、関連が因果関係か否かを評価するチェックリストとして提案したわけではなかったが、多くの者がそういうふうに利用しようとした。確かに、先に述べた因果の推論は難しく、かつ不確かで、単純なチェックリストの魅力は否定できない。残念ながらこのチェックリストは目的を同じくする他のリストと同様、因果的関係と非因果的関係を明確に分けたいという希望をかなえてはいないと評しています。こうした評価にあるように、ヒルの基準は決定的・絶対的なものではなく、基準を満たせばそれでいいというわけではありませんが、以下に各要件を少し詳しく見ていきます。

時間的関係

時間的関係 temporal relationship とは、AがBの原因となるためには、必ずAはBよりも時間的に前の時点で発生していなければならないという関係のことです。ある薬の効果を調べる際、「薬を飲み、そしてどうなるか」を確認する必要があります。病気が治った後に薬を飲んでも、意味はありません。

研究デザインの観点からは、曝露と疾病発生との時間的関係を最も明確に示すことができるのは介入研究です。「新薬Aを投与した群では疾病Bの発症率が対照群と比べて有意に低下した」というような介入研究の結果では、AがBの(予防)原因であると言及するための時間的関係が明確です。

いっぽう、観察研究ではどうかというと、コホート研究は適当ですが、ケース・コントロール研究や横断研究では曝露と疾病発生との時間的関係が不明確であるため、因果関係を論じることは困難になります。先の「肥満」と「運動不足」の関係が典型的で、どちらが時間的に先行していたのかによって、逆の因果関係が成り立ちます。

時間的関係はほかの要件とは異なり、最低限の条件として必要となる必須条件とされています。

一致性

一致性 consistency とは、対象者、時間、あるいは場所を変えたさまざまな設定においても、つねに同じような曝露と疾病発生との関連がみられることを指します。喫煙と肺がんの関係は、長年、積み重ねられてきたさまざまな研究で同様の結果が得られたことが一因となり、因果関係が認められました。

強固性

強固性 strength は、相対リスクの値が高いほど、原因である可能性が高いということです。予防的に働く場合は、相対危険が小さいほど強固性が高いと表現されます。

ただ、喫煙と肺がんの関係のように、原因構成の要素すべてが、引き起こす疾患と強い関連をもつわけではなく、関連の強さは他の要素の度合いに依存します。

また、強い関連が観測されても、それは真の因果関係ではなく、交絡の影響によって生じた見かけ上の関係である可能性もあります。たとえば、出生順位はダウン症発生に強く関連していますが、それは完全に母親の年齢で説明できる交絡による関連です。

こうしたことから、強固性を考える際には、バイアスや交絡の影響を加味する必要があります。

特異性

特異性 specificity とは、曝露を受けた人のみが発症する可能性を有するということです。曝露を受けた人のみ疾病を発症する場合は、曝露は疾病発生の必要条件、曝露を受けた人が必ず発症する場合は、十分条件です。ブドウ球菌による食中毒では、「ブドウ球菌が繁殖した食品を食べた」という曝露を受けた人のみ、それによる食中毒を発症するので、必要条件です。しかし、「ブドウ球菌が繁殖した食品」を食べても、その量が微量であれば食中毒を発症しない可能性もあります。この場合は、十分条件は満たしません。

疾病が複数の要因によって発生するとき、十分条件は相対的なものとなります。すなわち、要因A、B、Cがすべてそろった場合に発病するとした場合、この3つの要因が明らかになっていればA+B+Cが十分条件となりますが、たとえばCが未知の要因である場合には、AとBがそろっていても未知のCの有無によって発病するかどうかが定まるために十分条件とはなりません。また、1つの疾患と称されているものでもまったく性状が異なる場合もあります。したがって、1つの因子が十分条件になることは、多くの疾患であまり期待できません。

整合性

整合性 coherence とは、疫学研究で観察された関連が、他の研究知見と矛盾しないことを指します。実験動物を用いた研究で同様の関連が観察されると、その関連に因果関係がある可能性が高くなります。

量反応関係

量反応関係 does-response relationship とは、曝露(量、時間、量×時間)が増加するにつれて、相対リスクが大きくなること(予防的な場合は、小さくなる)を指します。これは喫煙本数が増えるほど肺がん死亡率が上昇するというものです。

生物学的妥当性

生物学的妥当性 biological plausibility は、「整合性」と似ていますが、疫学研究で得た関連が生物学的に説明できることを意味します。生物学的用量関係はしばしば因果関係の兆候とされるが、因果関係の結果でも交絡やその他のバイアスの結果でも起こります。先に述べたダウン症と出生順位の関係は生物学的用量関係を示しますが、母親の年齢による交絡で完全に説明できます。

実験

実験 experiment は、観察研究で得られた関連は、介入研究で確認できると因果関係を強く示唆できるということです。しかし、ヒトを対象にした介入研究の実施には倫理的な制限があるため、観察研究で得られた仮説を介入研究で証明しようとする姿勢は慎重である必要があります。

ルービンの因果モデル(反実仮想モデル)

自分だけを観測する場合

これまで因果推論についていろいろなことを解説してきましたが、例えば、「ある感染症に対するワクチンに効果があるか?」、すなわち、「ワクチンを接種することは、感染症を発症しないという結果の原因となるか」という命題を検証するためには、単純に「実際にワクチンを打ってみて、その感染症を発症するか否か」を調べるよりほかありません。

まず、最も単純な方法は、自分でワクチンを打ってみて、その感染症にかかるか否か、様子を見てみることです。この方法によって、その感染症を発症したら「ワクチンの効果はなかった」、発症しなければ「ワクチンの効果があった」という結論が得られそうです。

ただ、自分ひとりの発症の有無をもって、発症とワクチンとの間の因果関係を結論づけることはできません。それにはいくつか理由があります。まず、ワクチンは体内の病原体に対する抗体産生を促し、感染症に対する免疫を獲得するもので、発症を0にするというものではなく、本質的に、発症の確率を下げるものです。ワクチンを打っても発症する可能性がある以上、自分が発症した場合でも、一般的に「ワクチンに効果はなかった」と結論づけることはできません。

しかし、自分が発症しなかった場合に、「ワクチンの効果があった」と結論づけられるかというと、必ずしもそういうわけではありません。感染症の症状が発症するためには、体内にウィルスが侵入し、それがある程度繁殖して身体の中で悪さをし始める必要があります。極端なことを言えば、体内へのウィルスの侵入を阻止できていれば、ワクチンを打っても打たなくても、その感染症は発症しないことになります。実際に自分の体の中で何が起こっていたかは、ほとんどの場合分からないので、「発症しなかった」という事実が「ワクチンの効果によってウィルスの繁殖を抑えられたこと」によってもたらされたのか、それとも「ウィルスの侵入を防ぐことができたこと」によってもたらされたのか、区別することはできません。もしかしたら、「ワクチンを打たなくても十分な免疫力があり、感染しても発症しなかった」という可能性もあります。

このように、ワクチンの効果には個人差があり、ある個人が発症するかしないかも条件によって異なるため、自分ひとりの体験をもって、因果推論を行うことはできないのです。

反実仮想モデル

この中における「ある個人が発症するかしないかは条件によって異なる」という点について考えてみると、もし仮に、「ワクチンを打った世界線」の自分と「ワクチンを打たなかった世界線」の自分を観察し、それを比較することができれば、だいぶ問題が解消されそうです。2つの世界線の自分が、ワクチン接種の有無以外には、訪れた場所も、会った人も、食べたものも、睡眠時間も、すべての条件が完全に同じであり、「ワクチンを打った世界線」の自分は発症せず、「ワクチンを打たなかった世界線」の自分が発症すれば、ほぼ確定的に、「発症しなかったのはワクチンを接種したため」と結論づけることができます。

もちろん、こうしたことは現実世界で実現することはできません。ワクチンを接種しなければ「ワクチンを接種したときの結果」は確認できませんし、ワクチンを接種すれば「ワクチンを接種しなかったときの結果」は確認できません。ただ、こうした仮定は、有効な因果推論を行ううえで大きなヒントになる可能性を秘めていて、有望な方法である可能性があります。この考え方は、実際にはできない観察を想定して因果を考えることから、反実仮想モデル counterfactual model と呼ばれており、このモデルを最初に提唱した研究者の名前からルービンの因果モデル Rubin causal model とも呼ばれています。

集団を観測する場合

自分ひとりだけを観測する場合、ワクチンの効果に個人差があることが問題になったので、そうした個人差を打ち消すために、100人、1000人という集団単位で観測することを考えます。

ただ、集団単位で先ほどの反実仮想モデルを考えても、個人のときと同様の問題が生じます。すなわち、全員にワクチンを打ってしまうと「ワクチンを打たなかったときの結果」が分からず、全員にワクチンを打たなければ、「ワクチンを打ったときの結果」が観測できなくなってしまいます。

ここで、話の原点に立ち返ると、反実仮想モデルにおいて、本質的に実現したいことは、「曝露(介入)の有無以外には、完全に同じ条件で時間を進めたときに、結果が異なるかどうかを比較する」ということです。

この点、完全に理想的な状況ではないにせよ、次善の策として、「集団全体をA群とB群の2つに分け、A群にはワクチンを接種し、B群にはワクチンを接種しないで過ごしてもらう」という方法が考えられます。「A群とB群はあたかも完全なコピーであるかのように、条件がほぼ等しい」という仮定の下でこの方法によって観察を実施し、例えば、「A群は100人中10人が発症し、B群は100人中25人が発症した」という結果が得られた場合、発症人数の差15人、あるいは、発症した割合の差15%がワクチン接種による因果的効果であると推論することができます。

実際には、集団を2群に分ければ確実に有効な因果推論ができるかというとそういうわけではなく、交絡やバイアスなどへの対策のために研究デザインや統計解析段階での工夫が必要となりますが、「原因と結果の関連」、「治療や予防指導の効果・有効性」に関する仮説検証的な医学・疫学研究は、この反実仮想モデルの理論にもとづいて、行われています。

参考文献

  • 佐藤 俊哉 著. 宇宙怪人しまりす医療統計を学ぶ. 岩波書店, 2005, p.31-40
  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い. 篠原出版新社, 2013, p.41-59, p85-88
  • 比江島 欣愼 著. ぜんぶ絵で見る医療統計:身につく!研究手法と分析力. 羊土社, 2017, p.33-44
  • 中村 好一 著. 基礎から学ぶ楽しい疫学. 医学書院, 2020, p.122-131
  • ポール・ローゼンバウム 著, 阿部 貴行, 岩崎 学 訳. ローゼンバウム統計的因果推論入門:観察研究とランダム化実験. 共立出版, 2021, 389p.
  • 上原 里程. 関連と因果関係. 小児科診療. 2009, 72(4), p.703-705.
  • 鈴木 越治, 小松 裕和, 頼藤 貴志, 山本 英二, 土居 弘幸, 津田 敏秀. 医学における因果推論 第一部―研究と実践での議論を明瞭にするための反事実モデル―. 日本衛生学雑誌. 2009, 64(4), p.786-795, doi: 10.1265/jjh.64.786
  • 鈴木 越治, 小松 裕和, 頼藤 貴志, 山本 英二, 土居 弘幸, 津田 敏秀. 医学における因果推論 第二部―交絡要因の選択とバイアスの整理および仮説の具体化に役立つ Directed Acyclic Graph―. 日本衛生学雑誌. 2009, 64(4), p.796-805, doi: 10.1265/jjh.64.796

引用文献

  1. Hill, A.B.. The Environment and Disease: Association or Causation?. Proc R Soc Med. 1965, 58(5), p.295-300, PMCID: PMC1898525

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ