相関係数の定義と基本性質の証明

公開日: 更新日:

【2023年3月3週】 【B000】数理統計学 【B020】確率変数と確率分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、相関係数の定義を紹介し、その基本性質を証明しています。無相関と独立性の関係、線形変換後の相関係数、相関係数の範囲などの性質です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

相関係数

2次元確率変数 $X,Y$ の共分散をそれぞれの標準偏差 $\sigma_X,\sigma_Y$ の積によって標準化した値 \begin{align} \rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y} \end{align} を確率変数 $X,Y$ の相関係数 correlation coefficient と呼ぶ。 相関係数は、その値によって、 $0 \lt \rho_{XY}$ のとき 正の相関がある
$\rho_{XY} \lt 0$ のとき 負の相関がある
$\rho_{XY}=0$ のとき 無相関
という。

【定理】無相関と独立性

【定理】
無相関と独立性
Correlation Absence and Independence

確率変数 $X,Y$ が独立であれば、2変数は無相関である、すなわち、 \begin{align} f \left(x,y\right)=g \left(x\right) \cdot h \left(y\right)\Rightarrow\rho_{XY}=0 \end{align} となる。

証明

証明

独立なときの期待値の性質より、 \begin{align} E \left(XY\right)=E \left(X\right) \cdot E \left(Y\right) \end{align} 共分散の公式 $\mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)$ より、 \begin{align} \mathrm{Cov} \left(X,Y\right)=E \left(XY\right)-E \left(X\right)E \left(Y\right)=0 \end{align} 相関係数の定義式 $\rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}$ より、 \begin{align} \rho_{XY}=\frac{0}{\sigma_X\sigma_Y}=0 \end{align} $\blacksquare$

【命題】相関係数の基本性質

【命題】
相関係数の基本性質
Basic Property of Correlation Coefficient

$a,b,c,d$ を実数、かつ $a \neq 0,c \neq 0$ として、2つの確率変数 $X,Y$ を \begin{gather} U=aX+b\\ V=cY+d \end{gather} というかたちに線形変換するとき、 $X,Y$ の相関係数と $U,V$ の相関係数をそれぞれ、$\rho_{XY},\rho_{UV}$ とするとき、 \begin{align} \rho_{XY}=\frac{ac}{ \left|a\right| \left|c\right|}\rho_{UV} \end{align} が成り立つ。

証明

証明

共分散の定義式 $\mathrm{Cov} \left(X,Y\right)=E \left[ \left\{X-E \left(X\right)\right\} \left\{Y-E \left(Y\right)\right\}\right]$ より、 \begin{align} \mathrm{Cov} \left(U,V\right)&=E \left[ \left\{aX+b-E \left(aX+b\right)\right\} \left\{cY+d-E \left(cY+d\right)\right\}\right]\\ &=E \left[ \left\{aX+b-aE \left(X\right)-b\right\} \left\{cY+d-cE \left(Y\right)-d\right\}\right]\\ &=E \left[ \left\{aX-aE \left(X\right)\right\} \left\{cY-cE \left(Y\right)\right\}\right]\\ &=E \left[a \left\{X-E \left(X\right)\right\} \cdot c \left\{Y-cE \left(Y\right)\right\}\right]\\ &=acE \left[ \left\{X-E \left(X\right)\right\} \cdot \left\{Y-cE \left(Y\right)\right\}\right]\\ &=ac \cdot \mathrm{Cov} \left(X,Y\right) \end{align} 分散の性質 $V \left(aX+b\right)=a^2V \left(X\right)$ より、確率変数 $X,Y,U,V$ の標準偏差をそれぞれ $\sigma_X,\sigma_Y,\sigma_U,\sigma_V$ とすると、 \begin{gather} \sigma_U^2=V \left(aX+b\right)=a^2\sigma_X^2\Rightarrow\sigma_U= \left|a\right|\sigma_X\\ \sigma_V^2=V \left(cY+d\right)=c^2\sigma_Y^2\Rightarrow\sigma_V= \left|c\right|\sigma_Y \end{gather} 相関係数の定義式 $\rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}$ より、 \begin{align} \rho_{UV}&=\frac{\mathrm{Cov} \left(U,V\right)}{\sigma_U\sigma_V}\\ &=\frac{ac}{ \left|a\right| \left|c\right|} \cdot \frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y} \end{align} 相関係数の定義式 $\rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}$ より、 \begin{align} \rho_{XY}=\frac{ac}{ \left|a\right| \left|c\right|}\rho_{UV} \end{align} $\blacksquare$

【命題】相関係数の範囲

【命題】
相関係数の範囲
The Range of Correlation Coefficient

確率変数 $X,Y$ の相関係数は、-1以上、1以下の値しか取らない、すなわち、 \begin{align} -1 \le \rho_{XY} \le 1 \end{align} となる。

証明

証明

コーシー・シュワルツの不等式 $ \left\{E \left(UV\right)\right\}^2 \le E \left(U^2\right)E \left(V^2\right)$ において、 \begin{gather} U=X-E \left(X\right)\\ V=Y-E \left(Y\right) \end{gather} とすると、 \begin{align} \left[E \left[ \left\{X-E \left(X\right)\right\} \left\{Y-E \left(Y\right)\right\}\right]\right]^2 \le E \left[ \left\{X-E \left(X\right)\right\}^2\right]E \left[ \left\{X-E \left(X\right)\right\}^2\right] \end{align} 共分散と分散の定義式より、 \begin{gather} \left[\mathrm{Cov} \left(X,Y\right)\right]^2 \le \sigma_X^2\sigma_Y^2\\ \left[\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}\right]^2 \le 1 \end{gather} 相関係数の定義式 $\rho_{XY}=\frac{\mathrm{Cov} \left(X,Y\right)}{\sigma_X\sigma_Y}$ より、 \begin{gather} \rho_{XY}^2 \le 1\\ -1 \le \rho_{XY} \le 1 \end{gather} $\blacksquare$

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.87-89
  • 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.47-48
  • 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.54-55
  • 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.62-64
  • 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.65-66

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ