一般的に科学では、関心のある事象・現象を客観的に把握するために、しばしば、その事象を数値によって表現することを試みます。測定とは、現象を統計学的に処理可能な数値に変換するプロセスのことを指し、対象に数値を対応させる規則、およびその規則によって与えられる数値のことを尺度といいます。本稿では、そうした尺度について、解説します。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
離散変数と連続変数
一般的に科学では、関心のある事象・現象を客観的に把握するために、しばしば、その事象を数値によって表現します。数値変数 numeric variable とは、量(howmuch)やカウント数(howmany)を数値で表現する変数のことをいい、ざっくりと、離散変数と連続変数に分けられます。
連続変数 continuous variable とは、体重計で得られる体重値のように、理論的に全ての実数(小数点以下が存在する数)を取り得る変数で、最も情報量に富む変数です。これに対し、測定値が、たとえばタバコの本数のように、決まったユニット(一般には整数)で与えられる変数を離散変数 discrete variable と呼びます。離散変数が非常に多くの値をとるとき、離散変数は統計学的に連続変数に近い性格のものとなり、研究デザイン上は、連続変数とほぼ同等のものとみなすことができます。
質的変数と量的変数
また、データを分析の対象とする変数は、大まかに質的変数(定性変数)と量的変数(定量変数)に分けることができます。質的変数 qualitative variable は、性別や痛みの程度など、本来数値で表すことのできない(数量的でない)質的特性を表すもので、基本的に離散変数の形をとります。質的変数は、「あるカテゴリーに属していること」や「ある状態にあること」だけが分かるデータであり、計数値 count data やカテゴリー変数 categorical variable と呼ばれることもあります。カテゴリー(区分)が2つの場合(生・死など)を、2区分変数 dichotomous variable と呼び、それ以上の多くの区分を持つ場合は、多区分変数 polychotomous variable と呼びます。
いっぽう、量的変数 quantitative variable は、人数や入院日数、身長や体重など、数量として表すことのできる変数のことで、離散変数・連続変数どちらの形にもなり得ます。量的変数は、計量値 measurement data と呼ばれることもあります。
共変量
特に医学・疫学研究においては、人々の健康や患者の予後に影響を与える因子がよく研究の対象となります。そうした、予後の推定に役立つ変数を予後因子 prognostic factor と呼び、予後因子は、それが術中所見であれ、病理学的所見であれ予測変数 predictor variable と呼ばれます。
これに対して予測の対象である生死や生存時間は目的変数または基準変数 criterion variable と呼ばれます。予測変数は説明変数 explanatory variable や独立変数 independent variable、あるいは共変量 covariate、目的変数は従属変数 dependent variable と呼ばれることもあります。肝転移などは生死の推定のための予測変数にもなり得ますし、場合によってはそれ自体が予測の対象すなわち目的変数となることもあります。
疫学研究では研究の目的とその共変量の性質に応じて、リスク因子、交絡因子、修飾因子等と呼ばれます。共変量は大きく分けて①処理の違いを表す共変量、②個体(患者)固有の性質を表す共変量、③外性的な共変量(環境要因)の3タイプに分類できます。
処理の違いを表す共変量
①処理の違いを表す共変量とは、投薬される薬の種類あるいは量、または治療法の違いなどです。無作為化試験では確率的に決定され、観察研究の場合には研究者以外の主体によって決定されます。
個体(患者)固有の性質を表す共変量
性、年齢、人種などの人口統計学的因子が1つの重要なグループです。臨床研究であったら、疾患側の要因と患者側の要因がそれぞれ第2、第3のグループとなります。前者は、固形がんの場合であったらがんの大きさ、リンバ節転移、遠隔転移の有無あるいは程度、それを総合したステージ、組織型、ホルモン感受性がんの場合のレセプターの有無、最近の分子生物学の発展によって重要性が示されているがん遺伝子・がん抑制遺伝子、腫瘍マーカー値などからなります。後者は、患者の全般的な状態を表すPS(Performance Status)、免疫系パラメータ値、合併症の有無などからなります。
外性的な共変量(環境要因)
長期に渡る臨床研究では、後期では、慣れや補助的な治療法の改良のため全般的に患者予後の改善がみられたりする場合があります。このような時代効果も共変量の1つです。多施設で臨床試験を行う場合には、施設間差が問題になり、施設も代表的な外性的な共変量です。喘息の問題を扱うような場合には、花粉等のアレルゲンの状態、気温、気圧などの環境要因も外性的な共変量に含められます。
尺度水準
測定 measurement (検査や質問)とは、現象を統計学的に処理可能な数値に変換するプロセスのことを指し、対象に数値を対応させる規則、およびその規則によって与えられる数値のことを尺度 scale といいます。尺度は、その性質により名義尺度、順序尺度、間隔尺度、比尺度などの尺度水準 scale type, measurement level に分類されます$^\mathrm{(1)}$。
名義尺度
名義尺度 nominal scale とは、野球選手の背番号のように、その対象が同一のカテゴリーに属するか、違うカテゴリーに属するかを区別するためだけに用いられる尺度のことです。数の大きさそのものには意味がなく、単に記号としての意味しかありません(数値の大小関係が対象の特性の強弱に対応しているわけではない)。例えば、背番号の大小は、背番号3番の選手は背番号1番の選手より3倍優秀であるということを意味するわけではないということです。
例:性別、血液型、人種、疾患分類など
順序尺度
順序尺度 ordinal scale は、単に分類するだけでなく、対象の特性の強さの順序に対応するように数値が対応づけられる尺度です。順序尺度では、数の大小に意味はありますが、その差や比には意味がありません。例えば、成績の優れた順に「秀」「優」「良」「可」「不可」で評価されているとき、「秀」と「優」の差は、「優」と「良」の差や「可」と「不可」の差と必ずしも等しく定義されているとは限りません。
例:治療の効果(有効、不変、悪化)や痛みの程度(なし、軽度、重度)など
間隔尺度
間隔尺度 interval scale は、順序に加えて、数値の間隔(つまり値の差)が意味をもつような尺度です。数値の差が等しいとき、対象の特性強度の差も同じになりますが、数値の比を定義することはできません。例えば、「1990年01月01日と1991年01月01日の差」、「1991年01月01日と1992年01月01日の差」は、どちらも1年間とは言えますが、「1992年01月01日は1991年01月01日の○倍」と言うことはできません。
例:摂氏温度、日付・時刻(1990年01月04日)など
比尺度
比尺度 ratio scale は、間隔に加え、原点か定義でき、比が意味をもつような尺度です。例えば、体重が50 kg の人と40 kg の人の体重の差は10 kg、30 kg の人と20 kg の人の差も10 kg でどちらも等しい量といえます。また、10 kg の人は、20 kg の人の2倍重いと言うことも可能です。
例:身長(長さ)、体重(重さ)、経過時間など
間隔尺度と比尺度の違い
間隔尺度と比尺度は似ている尺度ですが、原点(0という値)の持つ意味に大きな違いがあります。端的に言えば、間隔尺度は0以下の値を取ることも可能であり、原点は、データどうしの相対的な位置関係を表す1点にすぎません。これに対し、比尺度は、0は「存在しない」ことの数値表現という意味があり、0以上の値しか取り得ない尺度ということができます。
例えば、比尺度である体重は、0 kg であれば、「物体として存在していない」ことを意味しますし、絶対温度で0 K であれば、「分子や原子の運動が完全に停止」していることを意味します。
いっぽう、摂氏温度で0 ℃ は、「分子や原子の運動がない」ということを意味しているのではなく、あくまでも「水の融点・凝固点」であるだけで、負の値も存在し得ます。
尺度水準によるデータの処理方法の違い
それぞれの尺度水準の説明の中で見てきた通り、それぞれの尺度には特徴がありますが、この特徴によって、データの処理方法に違いが生じます。
質的変数(名義尺度と順序尺度)
名義尺度と順序尺度は、本質的に「カテゴリーへの分類」のために使用する質的変数と言えますが、こうした質的変数は、四則演算をすることができないか、または十分な適切性がありません。
例えば、血液型(名義尺度)に、A型→1、B型→2、O型→3、AB型→4、その他→5という番号を振ったとき、$1+2=3$(A型+B型=O型)となるわけではありませんし、$4\div2=2$(AB型÷B型=B型)ともなりません。
同様に、症状の重さ(順序尺度)に、なし→0、軽症→1、中等症→2、重症→3という番号を振ったとき、$1+2=3$(軽症+中等症=重症)となるわけではありませんし、$3\times0=0$(重症×なし=なし)という計算はどう解釈していいのか分かりません。
こうしたことから、質的データは、ただ単純に出現度数のカウントのみが可能で、それに対応した最頻値や全体に占める割合などのみが求められます。いっぽう、算出に四則演算を必要とする平均や分散などは、求められないか、求めても適切に解釈することができません。
量的変数(間隔尺度と比尺度)
間隔尺度と比尺度は、対象を数量として表すことが可能なので、量的変数といえます。間隔尺度は、四則演算のうち、加法と減法のみが可能、比尺度は四則演算のすべてが可能です。このため、平均や分散、最頻値、中央値などの統計量を求めることができます。
尺度水準の変換
データをとる際には、できるだけ、情報量の多い尺度でデータをとった方が良いとされています。情報量の多さは、名義<順序<間隔<比の順に大きく、上位の尺度はそれよりも下の尺度に変換して使うことが可能です。
例えば、温度のデータを絶対温度(比尺度)で採取すると、
357、315、286、304、372、279、304、293、356、284、298、307、317、369、367、292、328、347、299、300 K
摂氏温度(間隔尺度)では、
84、42、13、31、99、6、31、20、83、11、25、34、44、96、94、19、55、74、26、27 ℃
とすることができます。
また、30 ℃ 以下→1.低温、30 ℃ 以上60 ℃ 未満→2.中温、60 ℃ 以上→3.高温という区分(順序尺度)を設けると、
3、2、1、2、3、1、2、1、3、1、1、2、2、3、3、1、2、3、1、1
とすることができ、
20 ℃ 以上30 ℃ 未満→1.適温、それ以外→2.不適温という区分(名義尺度)を設けると、
2、2、2、2、2、2、2、1、2、2、1、2、2、2、2、2、2、2、1、1
とすることができます。
こうした操作は、上位から下位への変換のみが可能で、下位から上位への変換はできません。そのため、できるだけ上位の尺度でデータをとっておいた方が、必要に応じて処理の段階で下位のデータに変換してから解析するなどの柔軟性があります。
尺度の選び方
一般的には、情報量が多く統計学的に有利という意味で、連続的な数値が得られるような尺度を選ぶのがよいと考えられます。たとえば、複数の降圧薬の治療効果を比較する場合、血圧を[mmHg]という連続値で表せば、治療効果を量的に評価することができますが、2区分スケール(高血圧、正常血圧)にすると、観察のきめが粗くなり、変化を捉えにくくなってしまいます。連続変数は情報量が多いために統計学的に有利で、統計学的検出力が大きく、サンプルサイズが小さくて済むというメリットがあります。
連続変数は、アウトカムとの関連のパターンが複雑な場合などに、カテゴリー変数よりも柔軟性が高いという利点があります。たとえば、ビタミンDとがん死亡率との間には、U型の関連(ビタミンDが低値と高値の場合に死亡率が高く、中間値では死亡率が低いという関係)があるため、それを捉えるためには、ビタミンDを連続変数で測定しておかねばなりません。また、低体重児出生の予測因子に関する研究では、2500 g という標準体重聞値より大きいか小さいかではなく、実際の出生体重を記録しておく必要があります。それによって、分析の選択肢が広がり、「低体重」の基準値を変更することも、いくつかの体重区分を表す順序変数(例:>2500 g、2000-2499 g、1500-1999 g、<1500 g)を作成することもできます。
同じように、食べ物の好き嫌いに関する質問のように・選択肢に順序変数を用いることができる場合には、選択肢を「非常にきらい」から「非常に好き」までの6段階の力テゴリーに分類しておくと便利です。なぜなら、後から「きらい」か「好き」かの2区分変数に仕立てることができるからです。しかし、その逆は不可能です。
カテゴリーや数値で表すことの難しい現象も少なくありません。症状(例痛み)やライフスタイルに関わるもの(生活の質 QOL など)は特にそうです。しかし、これらの現象も、診断や治療の決定上重要なことが多く、これらを測定することは、科学的アプローチにとって不可欠です。よく知られたものとしては、QOL測定の標準的スケールであるSF-36があります。このような標準的スケールの利用は、それが適切なものであれば、知識の客観性を高め、バイアスを減らし、また研究相互の比較が可能となるというメリットがあります。
参考文献
- 大橋 靖雄, 浜田 知久馬 著. 生存時間解析:SASによる生物統計. 東京大学出版会, 1995, p.14-17
- 前谷 俊三 著. 臨床生存分析:生存データと予後因子の解析. 南江堂, 1996, p.102-103
- スティーブン・ハリー, スティーブン・カミングス ほか 著, 木原 雅子, 木原 正博 訳. 医学的研究のデザイン:研究の質を高める疫学的アプローチ 第4版. メディカル・サイエンス・インターナショナル, 2014, p.37-39
- 丹後 俊郎, 松井 茂之 編集. 医学統計学ハンドブック 新版. 朝倉書店, 2018, p.20-24
- 丹後 俊郎, 小西 貞則 編集. 医学統計学の事典 新装版. 朝倉書店, 2018, p.196-197
引用文献
- Stevens, S.S.. On the Theory of Scales of Measurement. Science. 1946;103(2684):677-680, doi: 10.1126/science.103.2684.677
0 件のコメント:
コメントを投稿