データの一次変換による相関係数の変化
データ $x=[x_1, x_2, \cdots, x_n]$ と $y=[y_1, y_2, \cdots, y_n]$ について, 相関係数を $r_{xy}$ とする.
データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $x_k'=ax_k + b$ と変換したあとのデータを $x'$ とする. また, データ $y$ の各値 $y_k$ $(1 \leq k \leq n)$ を $y_k'=cy_k + d$ と変換したあとのデータを $y'$ とする.
データ $x'$ と $y'$ の相関係数を $r_{x'y'}$ とする.
このとき, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.
変量 $x, y$ を $x' = ax+b, y' = cy+d$ と変換したときの相関係数 $r_{x'y'}$ を求める。 (ただし $a, c$ は $0$ でない定数とする)
標準偏差および共分散の変換規則より, 次の関係が成り立つ。 $$ \begin{cases} s_{x'} = |a|s_x \\ s_{y'} = |c|s_y \\ s_{x'y'} = acs_{xy} \end{cases} $$
相関係数の定義式 $r = \frac{s_{xy}}{s_x s_y}$ にこれらを代入すると: $$ \begin{aligned} r_{x'y'} &= \frac{s_{x'y'}}{s_{x'}s_{y'}} \\[10pt] &= \frac{acs_{xy}}{|a|s_x \cdot |c|s_y} \\[10pt] &= \frac{ac}{|a||c|} \cdot \frac{s_{xy}}{s_x s_y} \end{aligned} $$
$|a||c| = |ac|$ であるから, 変換後の相関係数は次のようになる。 $$ r_{x'y'} = \frac{ac}{|ac|} r_{xy} $$
・$ac > 0$(同符号)のとき:$r_{x'y'} = r_{xy}$ (不変)
・$ac < 0$(異符号)のとき:$r_{x'y'} = -r_{xy}$ (符号が反転)
$y=[2, 4, 6]$ のとき, $y'=-x+2$ と変形すると, $y'=[0, -2, -4]$ になります。
$\displaystyle r_{x'y'}=-1$, $\displaystyle r_{xy}=1$ なので, $\displaystyle r_{x'y'}=\frac{2 \cdot (-1)}{|2| \cdot |-1|} r_{xy}$ が成り立っています。


