データの一次変換による相関係数の変化
データ $x$ と $y$ のそれぞれの各値を $x'=ax+b$, $y'=cy+d$ によって変換したあとのデータの相関係数 $r_{x'y'}$ が $\displaystyle \frac{ac}{|ac|}r_{xy}$ であることを示してみよう。
性質
データ $x=[x_1, x_2, \cdots, x_n]$ と $y=[y_1, y_2, \cdots, y_n]$ について, 相関係数を $r_{xy}$ とする.
データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $x_k'=ax_k + b$ と変換したあとのデータを $x'$ とする. また, データ $y$ の各値 $y_k$ $(1 \leq k \leq n)$ を $y_k'=cy_k + d$ と変換したあとのデータを $y'$ とする.
データ $x'$ と $y'$ の相関係数を $r_{x'y'}$ とする.
このとき, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.
証明.
データ $x$ と $y$ について, $x'=ax+b$ と $y'=cx'+d$ による標準偏差 $s_x$ と $s_y$, 共分散 $s_{xy}$ の変換は
$s_{x'} = |a|s_x$
$s_{y'} = |c|s_y$
$s_{x'y'} = acs_{xy}$
であった. 相関係数 $r_{x'y'}$ の定義式を計算すると,
$r_{x'y'}$
$=\displaystyle \frac{s_{x'y'}}{s_{x'}s_{y'}}$
$=\displaystyle \frac{acs_{xy}}{|a|s_{x} \times |c|s_{y}}$
$\displaystyle =\frac{ac}{|ac|}r_{xy}$
となる.
ゆえに, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.
たとえば,
$x=[1, 2, 3]$
のとき, $y=2x+1$ と変形すると,
$x'=[3, 5, 7]$
になります。
$y=[2, 4, 6]$
のとき, $y'=-x+2$ と変形すると,
$y'=[0, -2, -4]$
になります。
$\displaystyle r_{x'y'}=-1$,
$\displaystyle r_{xy}=1$
なので,
$\displaystyle r_{x'y'}=\frac{2 \cdot (-1)}{|2| \cdot |-1|} r_{xy}$
が成り立っています。