本稿では、共分散と相関係数についてまとめています。共分散と相関係数の定義や共分散の公式、共分散の分配法則、確率変数の和(差)の分散の一般公式、無相関と独立性、相関係数の範囲などの紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
共分散
2次元確率変数 $ \left(X,Y\right)$ があるとき、それぞれの偏差積の期待値 \begin{align} \mathrm{Cov}(X,Y)=E[ \left\{X-E \left(X\right)\right\} \left\{Y-E \left(Y\right)\right\}] \end{align} を確率変数 $X,Y$ の共分散 covariance と呼ぶ。 なお、共分散は、 \begin{align} \sigma_{XY} \end{align} と表されることもある。 それぞれの分散が存在する $V \left(X\right) \lt \infty,V \left(Y\right) \lt \infty$ とき、共分散は必ず存在する。
共分散の公式
【公式】
共分散の公式
Covariance
確率変数 $X,Y$ の共分散は、 \begin{align} \mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right) \end{align} で与えられる。
共分散の基本性質
【定理】
共分散の基本性質
Basic Property of Covariance
$a,b,c,d$ を実数、かつ $a \neq 0,c \neq 0$ として、確率変数 $X,Y$ を \begin{gather} W=aX+b\\ Z=cY+d \end{gather} と線形変換するとき、 変換後の確率変数同士の共分散は、 \begin{align} \mathrm{Cov} \left(aX+b,cY+d\right)=ac \cdot \mathrm{Cov} \left(X,Y\right) \end{align} となる。
共分散の分配法則
【定理】
共分散の分配法則
Distributive Property for Covariance
3つの確率変数 $X,Y,Z$ の共分散について、$X,Z$ の共分散と $Y,Z$ の共分散をそれぞれ \begin{align} \mathrm{Cov} \left(X,Z\right) \quad \mathrm{Cov} \left(Y,Z\right) \end{align} とすると、 $X+Y$ と $Z$ の共分散について、分配法則 \begin{align} \mathrm{Cov} \left(X+Y,Z\right)=\mathrm{Cov} \left(X,Z\right)+\mathrm{Cov} \left(Y,Z\right) \end{align} が成り立つ。
確率変数の和(差)の分散の一般公式
【公式】
確率変数の和(差)の分散の一般公式
General Variance Formula of Sum or Difference of Random Variables
(I)2次元確率変数 $X,Y$ それぞれの分散と共分散を \begin{align} V \left(X\right) \quad V \left(Y\right) \quad \mathrm{Cov} \left(X,Y\right) \end{align} とするとき、 2変数の和、あるいは差の分散は、 \begin{gather} V \left(X+Y\right)=V \left(X\right)+V \left(Y\right)+2\mathrm{Cov} \left(X,Y\right)\\ V \left(X-Y\right)=V \left(X\right)+V \left(Y\right)-2\mathrm{Cov} \left(X,Y\right) \end{gather} で与えられる。
(II)$n$ 次元確率変数 $X_1,X_2, \cdots ,X_n$ の分散が存在するとき、$n$ 変数の和の分散は、 \begin{gather} V \left(\sum_{i=1}^{n}X_i\right)=\sum_{i=1}^{n}V \left(X_i\right)+2\sum\sum_{i \lt j}{\mathrm{Cov} \left(X_i,X_j\right)}\\ \end{gather} で与えられる。
相関係数
2次元確率変数 $X,Y$ の共分散をそれぞれの標準偏差 $\sigma_X,\sigma_Y$ の積によって標準化した値
\begin{align}
\rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}
\end{align}
を確率変数 $X,Y$ の相関係数 correlation coefficient と呼ぶ。
相関係数は、その値によって、
$0 \lt \rho_{XY}$ のとき 正の相関がある
$\rho_{XY} \lt 0$ のとき 負の相関がある
$\rho_{XY}=0$ のとき 無相関
という。
無相関と独立性
【定理】
無相関と独立性
Correlation Absence and Independence
確率変数 $X,Y$ が独立であれば、2変数は無相関である、すなわち、 \begin{align} f \left(x,y\right)=g \left(x\right) \cdot h \left(y\right)\Rightarrow\rho_{XY}=0 \end{align} となる。
相関係数の基本性質
【命題】
相関係数の基本性質
Basic Property of Correlation Coefficient
$a,b,c,d$ を実数、かつ $a \neq 0,c \neq 0$ として、2つの確率変数 $X,Y$ を \begin{gather} U=aX+b\\ V=cY+d \end{gather} というかたちに線形変換するとき、 $X,Y$ の相関係数と $U,V$ の相関係数をそれぞれ、$\rho_{XY},\rho_{UV}$ とするとき、 \begin{align} \rho_{XY}=\frac{ac}{ \left|a\right| \left|c\right|}\rho_{UV} \end{align} が成り立つ。
相関係数の範囲
【命題】
相関係数の範囲
The Range of Correlation Coefficient
確率変数 $X,Y$ の相関係数は、-1以上、1以下の値しか取らない、すなわち、 \begin{align} -1 \le \rho_{XY} \le 1 \end{align} となる。
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.87-90
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.46-48
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.62-64
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.49-50
0 件のコメント:
コメントを投稿