横断研究

公開日: 更新日:

【2022年11月1週】 【A000】生物統計学 【A050】研究デザイン

この記事をシェアする
  • B!
サムネイル画像

ある集団についての情報がない場合、あるいは、現状把握が目的となる場合、記述的研究を行うことになりますが、そうした場合に適しているのが横断研究という手法です。本稿では、横断研究のデータの集め方や評価指標、特徴などについて解説しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

データの集め方

横断研究は、ある1時点(もしくは短期問の間)において、調査対象とする母集団から無作為にサンプルを抽出し、曝露と疾病の有無についてのデータを集める研究方法で、コホート研究と異なり、追跡(フォローアップ)期間は存在しません。調査対象となる疾病・曝露因子とその分布のパターンを記述するのに非常に適しています。

横断研究のデータの集め方
図1 横断研究のデータの集め方

連続横断研究

横断研究が、5年おきなど、定期的に実施されることがあります。これを、連続横断研究 serial prevalence study(serial survey) と呼びます。この種の研究は、経時変化についての推論を行う場合に用いられます。たとえば、Zitoら$^\mathrm{(1)}$は、横断調査を毎年実施することによって、中部大西洋岸の20歳未満の Medicaid(メディケイド) 受給者において、向精神薬使用者の存在率が、1987~1996年の間に3倍以上に増加したことを明らかにしています。

連続横断研究は縦断的 longitudinal ですが、これは、コホート研究ではありません。なぜなら、同じ集団のフォローアップ調査ではないからです。連続横断研究では、毎年新たに調査集団がサンプリングされるため、出生、死亡、高齢化、移住などによって、集団特性が毎年変化していくことになります。

分割表の形式

集められたデータは、以下のような $2\times2$ 分割表にまとめられます。

表1 横断研究に関する $2\times2$ 分割表(観測値)
発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$a$ $c$ $n_1$
非曝露群
$(\bar{E})$
$b$ $d$ $n_0$
合計 $m_1$ $m_0$ $N$

評価指標

縦断研究は、複数の時点でデータを収集し、経時的な変化を観察していく方法であるため、ある時点での有病率と発生率の両方を得ることができます。

それに対し、横断研究は、1点でのデータであるため、基本的に曝露状況ごとの疾病の有病率のみを得ることができます。疾病発生のみに注目した場合には有病状態が明らかになるので、有病調査 prevalence studies と呼ばれることもあります。

曝露群と非曝露群の有病率をそれぞれ \begin{gather} {\hat{\pi}}_1 \quad {\hat{\pi}}_0 \end{gather} とすると、 有病率や有病オッズの推定値は、次のように定義されます。

有病率

\begin{gather} {\hat{\pi}}_1=\frac{a}{n_1} \quad {\hat{\pi}}_0=\frac{b}{n_0} \end{gather}

有病オッズ

\begin{gather} {\mathrm{\widehat{OD}}}_1=\frac{a}{c} \quad {\mathrm{\widehat{OD}}}_0=\frac{b}{d} \end{gather}

曝露と疾病の関係性の評価

横断研究は、さまざまな因子への曝露とアウトカムとの関係性を調べるためにも用いることができます。絶対リスクや相対リスクの指標としては、主に、有病率差 excess prevalence有病率比 prevalence ratio が用いられます。以下の定義は、標準的と思われる定義ですが、差の場合は、どちらを引く数・引かれる数にするか、比の場合は、どちらを分母・分子とするかについて、研究者が自由に設定することができます。

有病率差:発症リスク差

\begin{gather} \mathrm{\widehat{RD}}={\hat{\pi}}_1-{\hat{\pi}}_0=\frac{a}{n_1}-\frac{b}{n_0} \end{gather}

有病率比①:発症リスク比

\begin{gather} \mathrm{\widehat{RR}}=\frac{{\hat{\pi}}_1}{{\hat{\pi}}_0}=\frac{an_0}{bn_1} \end{gather}

有病率比②:発症オッズ比

\begin{gather} \mathrm{\widehat{OR}}=\frac{{\mathrm{\widehat{OD}}}_1}{{\mathrm{\widehat{OD}}}_0}=\frac{{\hat{\pi}}_1}{1-{\hat{\pi}}_1} \cdot \frac{1-{\hat{\pi}}_0}{{\hat{\pi}}_0}=\frac{ad}{bc} \end{gather}

横断研究の例

例えば、Reijneveld$^\mathrm{(2)}$は、母親の喫煙が幼児の疝痛発作のリスクファクターとなるかどうかを評価するために、横断研究を実施しました。その結果の一部を以下に示します。

発症あり
$ \left(D\right)$
発症なし
$(\bar{D})$
合計
曝露群
$ \left(E\right)$
$15$ $167$ $182$
非曝露群
$(\bar{E})$
$111$ $2477$ $2588$
合計 $126$ $2644$ $2770$

曝露群の有病率 \begin{align} {\hat{\pi}}_1=\frac{15}{182}=8.2\% \end{align} 非曝露群の有病率 \begin{align} {\hat{\pi}}_0=\frac{111}{2588}=4.3\% \end{align} 有病率差 \begin{align} \mathrm{\widehat{RD}}={\hat{\pi}}_1-{\hat{\pi}}_0=8.2-4.3=3.9\% \end{align} 有病率比 \begin{align} \mathrm{\widehat{RR}}=\frac{{\hat{\pi}}_1}{{\hat{\pi}}_0}=\frac{8.2}{4.3}=1.9 \end{align}

言い換えれば、喫煙する母親の幼児では、喫煙をしない母親の幼児よりも、約2倍、率にして約4%多く、疝痛が発生しやすいということになります。

不変的な曝露

後述するように、一般的には、横断研究で曝露と疾病の関係を議論する際には注意が必要ですが、不変的な曝露(性別や人種、遺伝子多型など)については、まったく問題なく疾病発生との関連について論じることが可能であるとされています。

特徴:利点と欠点

長所①:相対的にコストがかからない

コホート研究や実験的研究と比較した場合の、横断研究の最も大きな利点は、アウトカムが発生するのを待たなくてもよいということです。したがって、比較的早く、低いコストで研究ができ、フォローアップ期間中の対象者の脱落という厄介な問題に頭を悩ますこともありません。そのため、横断研究は、コホート研究や実験的研究の第1段階として行われることもあります。その場合、その結果は、研究対象となる集団のベースライン時点での属性や臨床的特性に関する情報として扱われますが、この段階ですでに、研究目的とする関連の存在が因子間に示唆されることがあります。

「相対的にコストがかからない」のイメージ図
図2 相対的にコストがかからない

長所②:情報の正確性(データの妥当性)が高い

例えば、喫煙と肺がんの関係について調べたいと考えた場合、後ろ向きに「10年前には、1日あたり何本吸っていましたか?」と尋ねても、たいていの人は、そこまで正確に思い出すことはできませんし、「半年前から本数の記録をつけている」といった記録がある場合でも、それが必ず入手できるわけではありません。

また、前向きに「これから本数を記録し始めて、5年後に肺の状況を調べる」とする場合も、その人が転居などによって脱落してしまったり、あるとき、記録をし忘れて、ついそのままフェードアウトしてしまうということもあり得ます。

このように、情報の正確性(データの妥当性)は現在(目の前のこと)が最も高く、これが過去にさかのぼっても将来にわたっても、現在から時間が離れるほど、妥当性は劣ってきますが、現在という1点に絞っているため、横断研究は、ほかの研究方法よりも、情報の正確性(データの妥当性)が高いという利点があります。

「情報の正確性(データの妥当性)が高い」のイメージ図
図3 情報の正確性(データの妥当性)が高い

短所①:因果関係の推測には向かない

因果関係は、「原因があって、結果が起こる」、すなわち「危険因子への曝露(原因)によって、疾患が発症した(結果)」という関係のことです。したがって、因果関係を示すためには、基本的に、経時的な変化を追う必要があり、危険因子に曝露された集団と曝露されていない集団の間で、発生率が異なることを示さなければなりません。この点、横断研究は「経時的な変化」を明らかにすることはできないので、疾患の予後や、自然経過、病因について情報を得る方法としては限界があります。

また、横断研究においては、一般に、何を予測因子とし、何をアウトカムとするかの判断はそう簡単ではありません。例えば、現在、肺がんと診断されている人に「現在、禁煙してしますか?」と尋ねた結果、「禁煙している」と答えた人の方が高いという結果が得られたとします。この情報だけを見れば、「禁煙したことが肺がんの原因になっているのか?」と考えることもできますが、より詳しく調べて見ると、「喫煙」→「肺がんの初発症状としての咳の出現」→「咳のために禁煙」→「肺がんの診断」と進行していたことが分かりました。この場合、実際には、「喫煙と肺がんに関連あり」という真実が隠され、「禁煙と肺がん発生が関連あり」という、誤った結論を導いてしまうところでした(こうした現象は、交絡と呼ばれています。交絡については、別の記事でより詳しく説明します)。このように、有病者は病気になった結果から生活習慣や曝露状況が変わっていることが多く、新規発生者は疾病発生前後の変化が捉えられることから、曝露‐疾病間の因果関係を調べるためには有病よりも発生を調べる方がよいといわれています。

また、「テレビやインターネットの視聴時間と肥満」の関係について調べる場合、どちらが原因で、どちらが結果と言えるでしょうか?「テレビやインターネットをよく見る分、運動する時間が減り、それが肥満につながる」とも言えそうですし、「もともと肥満だから、運動に対する意欲が湧かず、持て余した時間をテレビやインターネットに費やしている」とも言えそうです。こうした「鶏と卵」の関係にある問題についても、「因果関係」を示すことは難しいと言えます。このように、横断研究は、因果関係の推測にはあまり向かず、その多くは、関連性までしか議論できません

「因果関係の推測には向かない」のイメージ図
図4 因果関係の推測には向かない

短所②:稀な疾患を扱う場合には向かない

また、横断研究は、一般健康集団における稀な疾患を扱うには不向きです。なぜなら、曝露群にも非曝露群にも、疾病を発症している人が1人も含まれていないということが起こり得るからです。この場合、曝露の影響を調べることはできません。

「稀な疾患を扱う場合には向かない」のイメージ図
図5 稀な疾患を扱う場合には向かない

しかし、たとえ稀な疾患であっても、対象が一般健康集団ではなく患者集団であれば、横断研究が可能なこともあります。この種の研究は、ケース・シリーズ(症例研究) case series と呼ばれるもので、患者と健康人の違いの分析というより、その疾患の特徴を記述することを目的とするものです。しかし、この種の研究によって、経験的比較から、非常に強いリスクフアクターを発見できることもあります。

たとえば、最初のエイズ患者1000人のうち、727人は同性愛者あるいは両性愛者で、236人が静注薬物常用者でした$^\mathrm{(3)}$。この場合、これらのグループが高リスクであることは自明であり、あえて正式なコントロール群と比較する必要はありません。また、患者間の比較から興味深い関連が見出されることもあり、たとえば、この研究では、静注薬物使用者よりも同性愛者のエイズ患者に、カポジ肉腫のリスクが高いことが明らかにされています。

参考文献

  • ケネス・ロスマン 著, 矢野 栄二, 橋本 英樹, 大脇 和浩 監訳. ロスマンの疫学. 篠原出版新社, 2013, p.149-151
  • スティーブン・ハリー, スティーブン・カミングス ほか 著, 木原 雅子, 木原 正博 訳. 医学的研究のデザイン. メディカル・サイエンス・インターナショナル, 2014, p.98-101
  • 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック. 朝倉書店, 2018, p.15
  • 中村 好一 著. 基礎から学ぶ楽しい疫学. 医学書院, 2020, p.53-54

引用文献

  1. Zito, J.M., Safer, D.J., DosReis, S. et al.. Psychotropic practice patterns for youth: a 10-year perspective. Archives of pediatrics & adolescent medicine. 2003;157(1):17-25, doi: 10.1001/archpedi.157.1.17
  2. Reijneveld, S.A., Brugman, E. & Hirasing, R.A.. Infantile colic: maternal smoking as potential risk factor. Archives of disease in childhood. 2000;83(4):302-303, doi: 10.1136/adc.83.4.302
  3. Jaffe, H.W., Bregman, D.J. & Selik, R.M.. Acquired immune deficiency syndrome in the United States: the first 1,000 cases. The Journal of infectious diseases. 1983;148(3):339-345, doi: 10.1093/infdis/148.2.339

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ