医学・疫学研究を実施するにあたり、交絡への対策は非常に重要とされていますが、そうした交絡への対策のひとつに層別解析という手法があります。層別解析には、大別して標準化とプール化の2種類がありますが、本稿では、それらのうち、プール化の方法として特に有名なマンテル・ヘンツェルの方法について解説しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合(
など)や「2」である場合( など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
目次[非表示]
周辺解析と粗効果
交絡とは、ある危険因子とアウトカムの関係を評価する際、「第3の因子の影響によって、見かけ上、関連があるように(もしくは、ないように)見えてしまう現象」のことで、適切な因果推論を妨げる厄介な現象です。ここで、交絡によって観測が歪められる例をもう一度見てみましょう。
例えば、コーヒーの摂取と心筋梗塞の関係についてケース・コントロール研究で調べた結果、次のような分割表が得られたとしましょう。
曝露あり | 曝露なし | 合計 | |
---|---|---|---|
ケース群 | |||
コントロール群 | |||
合計 |
このとき、曝露オッズ比は、
このように、単層の分割表(曝露・発症状況のみにもとづいた単純な区分け)のデータをそのまま解析することを周辺解析 marginal analysis、あるいは調整なし解析 unadjusted analysis といい、周辺解析によって得られた曝露効果(リスク比やオッズ比など)のことを粗効果 crude effect といいます
サブグループ解析
交絡の影響を除去する方法としてまず考えられるのは、交絡因子となり得る因子(年齢や性別など)によって両群を更に区分けし(サブグループを作る)、新たにできた層ごとに曝露効果を推定するという方法です。例えば、喫煙状況で層別し、それぞれでオッズ比を算出するということです。先ほどの例を喫煙状況で層別すると、
曝露あり | 曝露なし | 合計 | |
---|---|---|---|
ケース群 | |||
コントロール群 | |||
合計 |
曝露あり | 曝露なし | 合計 | |
---|---|---|---|
ケース群 | |||
コントロール群 | |||
合計 |
このとき、曝露オッズ比は、
このような方法をサブグループ解析 subgroup analysis や条件付き層内解析 conditional stratified analysis といいます。この方法は、基本的に研究デザインの段階で行う「対象者の限定」を解析段階で事後的に行っていると言うこともできます。
サブグループ解析は、交絡因子の影響を除去するうえでの単純かつ確実な方法で、因子間の交互作用の影響を調べることができるなどの長所がある方法です。
いっぽうで、層化(サブグループ化)することで各層のサンプルサイズが小さくなり、検出力が低下してしまう、検定の多重性の問題により、第1種の過誤確率が増大してしまう、因子間の交互作用の影響も取り除いた、関心のある因子単独の曝露効果が分からないなどの短所もあります。
層別解析
こうしたことから、交絡の影響を取り除き、かつ、すべての層に通底するような因子単独の効果を把握できるような解析方法が必要とされました。この要望に応えたのが層別解析と呼ばれる手法です。
層別解析 stratified analysis とは、サブグループごとの結果を統合して、1つの曝露効果を推定するための方法で、基本的な方法として「プール化」と「標準化」の2通りの方法があります。
標準化は、端的にいうと、「曝露グループが曝露を受けなかった場合」を予想する方法です。プール化とは異なり、「すべての層にわたって曝露効果が同じ値である」という仮定は必要とせず、効果の指標の修飾や交互作用が存在している場合でも、妥当な方法と言えます。
これに対し、プール化はすべての層にわたって曝露効果が同じ値であると仮定し、層別の推定値を加重平均して、すべての層に共通する共通効果を求める方法です。この仮定が成り立つ場合、プール化は標準化よりも推定の精度や検定における検出力が優れた方法になります。本稿では、このプール化の代表的な方法であるマンテル・ヘンツェルの方法について、後で詳しく見ていきます。
層別解析で交絡因子の影響が取り除かれる原理
層別解析は、「交絡因子の影響を取り除いた、その因子単独の曝露効果を推定するための方法」ということができますが、交絡は、関心のある因子の曝露効果と交絡変数の効果が混ざることで発生します。例えば、ある病気の男女差を調べようと思った際、男性は若年者、女性は高齢者が多かった場合、実質的に、「若年者」と「高齢者」の比較になってしまうことによって、交絡が発生します。
この点、層化は、事後的に行う「対象者の限定」であり、「対象者の限定」の原理にもとづいて、交絡因子の影響が除去された曝露効果の指標(リスク比やオッズ比など)が得られます。その結果、複数の曝露効果の指標(層別の推定値 stratum-specific estimate)が出てきますが、層別解析は、「それらを1つに統合することで、関心のある因子単独の曝露効果を分かりやすいかたちで把握すること」を試みているということができます。
この話の中の「1つに統合する方法」は、基本的に「加重平均を求める」ということになりますが、その際の重みのつけ方に何種類かの考え方があります。
プール化
層別解析におけるプール化 pooling とは、因子同士の交互作用などはなく、因子の曝露効果は、すべての層を通じて同じであるという仮定(効果均一性の前提 assumption of uniformity of effect)にもとづき、層別の推定値の加重平均を求める方法です。プール化では、マンテル・ヘンツェルの方法最も情報を与える層、すなわち最もデータをもつ層が、最も重みを得るように重み付けされる
という考えによる重みのつけ方を採用しています。
以下、研究デザインや曝露効果の指標ごとに、マンテル・ヘンツェルの方法による推定値や推定値の分散の公式を紹介します。
マンテル・ヘンツェル推定量
ここでは、収集したデータが交絡因子と考えている共変量の値によって、
有病率・発生割合データのコホート研究
発生リスク差
発生リスク比
発生率テータのコホート研究
発生率差
発生率比
ケース・コントロール研究
曝露オッズ比
コクラン・マンテル・ヘンツェル検定
共通の曝露効果については、点推定や区間推定を行うだけでなく、統計学的検定を行うこともできます。その際に使用される検定統計量は、マンテル・ヘンツェル
具体的な検定統計量の公式は、以下のとおりですが、有病率・発生割合データとケース・コントロール研究のデータについては、以下のように、オッズ比を用いて帰無仮説と対立仮説の評価を行います。
帰無仮説を
全層共通のオッズ比が1である
⇔すべての層で曝露群と非曝露群の発症確率が等しい
⇔各層の曝露群と非曝露群の発症確率は等しくない
マンテル・ヘンツェル検定
有病率・発生割合データとケース・コントロール研究
発生率データ
コクラン検定
マンテル・ヘンツェル推定量の例題
では、実際に例題
周辺解析
発症あり | 発症なし | 合計 | |
---|---|---|---|
曝露群 | |||
非曝露群 | |||
合計 |
周辺解析による発生割合は、
したがって、発生リスク差と発生リスク比はそれぞれ
層別解析
発症あり | 発症なし | 合計 | |
---|---|---|---|
曝露群 | |||
非曝露群 | |||
合計 |
発症あり | 発症なし | 合計 | |
---|---|---|---|
曝露群 | |||
非曝露群 | |||
合計 |
層別解析によるそれぞれの発生割合は、
したがって、発生リスク差と発生リスク比はそれぞれ
発生リスク差のマンテル・ヘンツェル推定量は、
発生リスク比のマンテル・ヘンツェル推定量は、
層別解析の長所
柔軟にさまざまな検証ができる
解析段階での交絡調整の方法には、層別解析の他に多変量解析がありますが、多変量解析を人の手で行うことは難しく、ほとんどの場合、統計パッケージの力を必要とします。統計パッケージの利用は非常に便利ではありますが、しばしば結果の算出過程がブラックボックス化されていて、何らかの間違いがあったとしても、それを検証することが難しい場合が少なくありません。
この点、層別解析は比較的結果の導出方法が簡単で、やろうと思えば、電卓や表計算ソフトなどでも解析を行うことができます。また、層別解析には、最初にどれが予測因子でどれが交絡因子かを固定する必要がなく、自由に入れ替えることができるという利点もあります。そのため、まず、さまざまな因子で層化してみて、交絡因子となり得る因子の分布が偏っていないかを確認したり、ある因子で層化した分析と層化していない分析を比較し、結果に差が出るかどうかを確認することで交絡の有無を判別することが推奨されています。
また、層別解析ではほとんど前提を必要としないので、結果にバイアスが生じる可能性が少ない方法であるともされています。
層別解析の短所
コントロールできる因子の数が限られる
層別解析の主な短所は、1度にコントロールできる因子の数が限られることです。たとえば、年齢、性格、最高血圧、血清コレステロール値、喫煙歴の5因子すべてを用いて層化しようとすると、それぞれの因子の層数がたとえ3であっても、全層数は
残差交絡
各層に十分な数の対象者を確保するために、因子の層区分を2つだけとすることがよくありますが、この場合、層の幅が広すぎると、交絡の影響を十分に除去できないおそれがあります。たとえば、コーヒーの摂取量と心筋梗塞の関係を調べている時、年齢を50歳未満と50歳以上の2層にしか分けなかったとき、もし、それぞれの層の中で、年齢の高い人ほどコーヒー飲用量が多く、しかも心筋梗塞のリスクも高いとすると、コーヒーと心筋梗塞との関係には、なお、年齢の交絡が残っていることになります。これは、いわば「層内の交絡」といえる現象で、このような層内の交絡のことを残差交絡 residual confunding といいます。
このような残差交絡を避けるためにはより多くの層にデータを区切って、できれば上限のない層(たとえば55歳以上など)は避けるのが望ましい
とされていますが、いっぽうで、あまりに細かく層化しすぎると不合理にデータが引き伸ばされ、セル内の事象の頻度は小さくなり不正確な結果を導く可能性
があるため、適切な区分を設けることためには、試行錯誤の中で、「交絡の除去」と「統合した推定量の推定精度」とのバランスを取ることが必要となります。
参考文献
- ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.248-262, p.268-269
- 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック 新版. 朝倉書店, 2018, p.514-517
- 丹後 俊郎, 小西 貞則 編集. 医学統計学の事典 新装版. 朝倉書店, 2018, p.99-100
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.135-139
- 福富 和夫. マンテル・ヘンツェルの検定. 日本循環器管理研究協議会雑誌. 1989, 24(2), p.104-105, doi: 10.11381/jjcdp1974.24.104
- 佐藤 俊哉, 高木 廣文, 柳川 堯, 柳本 武美. Mantel‐Haenszelの方法による複数の2×2表の要約. 統計数理. 1998, 46(1), p.153-177, http://hdl.handle.net/10787/316
引用文献
- Mantel, N. & Haenszel, W.. Statistical Aspects of the Analysis of Data From Retrospective Studies of Disease. Journal of the National Cancer Institute. 1959, 22(4), p.719-748, doi: 10.1093/jnci/22.4.719
- Mantel, N.. Chi-square tests with one degree of freedom: Extensions of the Mantel-Haenszel procedure. Journal of the American Statistical Association. 1963, 58, p.690-700, doi: 10.2307/2282717
- Robins, J., Breslow, N. & Greenland, S.. Estimators of the Mantel-Haenszel variance consistent in both sparse data and large-strata limiting models. Biometrics. 1986, 42(2), p.311-323, doi: 10.2307/2531052
- Robins, J., Greenland, S. & Breslow, N.. A general estimator for the variance of the Mantel-Haenszel odds ratio. Am J Epidemiol. 1986, 124(5), p.719-723, doi: 10.1093/oxfordjournals.aje.a114447
- Cochran, W.G.. Some Methods for Strengthening the Common
Tests. Biometrics. 1954;10(4):417-451, doi: https://doi.org/10.2307/3001616 - ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学:科学的思考への誘い 第2版. 篠原出版新社, 2013, p.250-252
脚注
- 「粗効果」は総称で、実際には「粗+指標名」で表現されます。例えば、求めたものがリスク比なら「粗リスク比」、オッズ比なら「粗オッズ比」となります。
0 件のコメント:
コメントを投稿