共分散と相関係数

公開日: 更新日:

【2023年3月3週】 【B000】数理統計学 【B020】確率変数と確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、共分散と相関係数についてまとめています。共分散と相関係数の定義や共分散の公式、共分散の分配法則、確率変数の和(差)の分散の一般公式、無相関と独立性、相関係数の範囲などの紹介が含まれます。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

共分散

2次元確率変数 $ \left(X,Y\right)$ があるとき、それぞれの偏差積の期待値 \begin{align} \mathrm{Cov}(X,Y)=E[ \left\{X-E \left(X\right)\right\} \left\{Y-E \left(Y\right)\right\}] \end{align} を確率変数 $X,Y$ の共分散 covariance と呼ぶ。 なお、共分散は、 \begin{align} \sigma_{XY} \end{align} と表されることもある。 それぞれの分散が存在する $V \left(X\right) \lt \infty,V \left(Y\right) \lt \infty$ とき、共分散は必ず存在する。

共分散の公式

【公式】
共分散の公式
Covariance

確率変数 $X,Y$ の共分散は、 \begin{align} \mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right) \end{align} で与えられる。

共分散の基本性質

【定理】
共分散の基本性質
Basic Property of Covariance

$a,b,c,d$ を実数、かつ $a \neq 0,c \neq 0$ として、確率変数 $X,Y$ を \begin{gather} W=aX+b\\ Z=cY+d \end{gather} と線形変換するとき、 変換後の確率変数同士の共分散は、 \begin{align} \mathrm{Cov} \left(aX+b,cY+d\right)=ac \cdot \mathrm{Cov} \left(X,Y\right) \end{align} となる。

共分散の分配法則

【定理】
共分散の分配法則
Distributive Property for Covariance

3つの確率変数 $X,Y,Z$ の共分散について、$X,Z$ の共分散と $Y,Z$ の共分散をそれぞれ \begin{align} \mathrm{Cov} \left(X,Z\right) \quad \mathrm{Cov} \left(Y,Z\right) \end{align} とすると、 $X+Y$ と $Z$ の共分散について、分配法則 \begin{align} \mathrm{Cov} \left(X+Y,Z\right)=\mathrm{Cov} \left(X,Z\right)+\mathrm{Cov} \left(Y,Z\right) \end{align} が成り立つ。

確率変数の和(差)の分散の一般公式

【公式】
確率変数の和(差)の分散の一般公式
General Variance Formula of Sum or Difference of Random Variables

(I)2次元確率変数 $X,Y$ それぞれの分散と共分散を \begin{align} V \left(X\right) \quad V \left(Y\right) \quad \mathrm{Cov} \left(X,Y\right) \end{align} とするとき、 2変数の和、あるいは差の分散は、 \begin{gather} V \left(X+Y\right)=V \left(X\right)+V \left(Y\right)+2\mathrm{Cov} \left(X,Y\right)\\ V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right) \end{gather} で与えられる。

(II)$n$ 次元確率変数 $X_1,X_2, \cdots ,X_n$ の分散が存在するとき、$n$ 変数の和の分散は、 \begin{gather} V \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}V \left(X_i\right)+2\sum\sum_{i \lt j}{\mathrm{Cov} \left(X_i,X_j\right)}\\ \end{gather} で与えられる。

相関係数

2次元確率変数 $X,Y$ の共分散をそれぞれの標準偏差 $\sigma_X,\sigma_Y$ の積によって標準化した値 \begin{align} \rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y} \end{align} を確率変数 $X,Y$ の相関係数 correlation coefficient と呼ぶ。 相関係数は、その値によって、 $0 \lt \rho_{XY}$ のとき 正の相関がある
$\rho_{XY} \lt 0$ のとき 負の相関がある
$\rho_{XY}=0$ のとき 無相関
という。

無相関と独立性

【定理】
無相関と独立性
Correlation Absence and Independence

確率変数 $X,Y$ が独立であれば、2変数は無相関である、すなわち、 \begin{align} f \left(x,y\right)=g \left(x\right) \cdot h \left(y\right)\Rightarrow\rho_{XY}=0 \end{align} となる。

相関係数の基本性質

【命題】
相関係数の基本性質
Basic Property of Correlation Coefficient

$a,b,c,d$ を実数、かつ $a \neq 0,c \neq 0$ として、2つの確率変数 $X,Y$ を \begin{gather} U=aX+b\\ V=cY+d \end{gather} というかたちに線形変換するとき、 $X,Y$ の相関係数と $U,V$ の相関係数をそれぞれ、$\rho_{XY},\rho_{UV}$ とするとき、 \begin{align} \rho_{XY}=\frac{ac}{ \left|a\right| \left|c\right|}\rho_{UV} \end{align} が成り立つ。

相関係数の範囲

【命題】
相関係数の範囲
The Range of Correlation Coefficient

確率変数 $X,Y$ の相関係数は、-1以上、1以下の値しか取らない、すなわち、 \begin{align} -1 \le \rho_{XY} \le 1 \end{align} となる。

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.87-90
  • 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.46-48
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.62-64
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.49-50

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ