データの一次変換による相関係数の変化

データ $x$ と $y$ のそれぞれの各値を $x'=ax+b$, $y'=cy+d$ によって変換したあとのデータの相関係数 $r_{x'y'}$ が $\displaystyle \frac{ac}{|ac|}r_{xy}$ であることを示してみよう。

性質

データ $x=[x_1, x_2, \cdots, x_n]$ と $y=[y_1, y_2, \cdots, y_n]$ について, 相関係数を $r_{xy}$ とする.

データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $x_k'=ax_k + b$ と変換したあとのデータを $x'$ とする. また, データ $y$ の各値 $y_k$ $(1 \leq k \leq n)$ を $y_k'=cy_k + d$ と変換したあとのデータを $y'$ とする.

データ $x'$ と $y'$ の相関係数を $r_{x'y'}$ とする.

このとき, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.

証明.

データ $x$ と $y$ について, $x'=ax+b$ と $y'=cx'+d$ による標準偏差 $s_x$ と $s_y$, 共分散 $s_{xy}$ の変換は

$s_{x'} = |a|s_x$

$s_{y'} = |c|s_y$

$s_{x'y'} = acs_{xy}$

であった. 相関係数 $r_{x'y'}$ の定義式を計算すると,

$r_{x'y'}$

$=\displaystyle \frac{s_{x'y'}}{s_{x'}s_{y'}}$

$=\displaystyle \frac{acs_{xy}}{|a|s_{x} \times |c|s_{y}}$

$\displaystyle =\frac{ac}{|ac|}r_{xy}$

となる.

ゆえに, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.

たとえば,

$x=[1, 2, 3]$

のとき, $y=2x+1$ と変形すると,

$x'=[3, 5, 7]$

になります。

$y=[2, 4, 6]$

のとき, $y'=-x+2$ と変形すると,

$y'=[0, -2, -4]$

になります。

$\displaystyle r_{x'y'}=-1$,
$\displaystyle r_{xy}=1$

なので,

$\displaystyle r_{x'y'}=\frac{2 \cdot (-1)}{|2| \cdot |-1|} r_{xy}$

が成り立っています。

コメントを残す