データの一次変換による相関係数の変化

データ $x$ と $y$ のそれぞれの各値を $x'=ax+b$, $y'=cy+d$ によって変換したあとのデータの相関係数 $r_{x'y'}$ が $\displaystyle \frac{ac}{|ac|}r_{xy}$ であることを示してみよう。
命題(一次変換による相関係数の変化)

データ $x=[x_1, x_2, \cdots, x_n]$ と $y=[y_1, y_2, \cdots, y_n]$ について, 相関係数を $r_{xy}$ とする.

データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $x_k'=ax_k + b$ と変換したあとのデータを $x'$ とする. また, データ $y$ の各値 $y_k$ $(1 \leq k \leq n)$ を $y_k'=cy_k + d$ と変換したあとのデータを $y'$ とする.

データ $x'$ と $y'$ の相関係数を $r_{x'y'}$ とする. このとき, $r_{x'y'}=\displaystyle \frac{ac}{|ac|}r_{xy}$ が成り立つ.

変量 $x, y$ を $x' = ax+b, y' = cy+d$ と変換したときの相関係数 $r_{x'y'}$ を求める。 (ただし $a, c$ は $0$ でない定数とする)

§各統計量の変換規則

標準偏差および共分散の変換規則より, 次の関係が成り立つ。 $$ \begin{cases} s_{x'} = |a|s_x \\ s_{y'} = |c|s_y \\ s_{x'y'} = acs_{xy} \end{cases} $$

§相関係数の計算

相関係数の定義式 $r = \frac{s_{xy}}{s_x s_y}$ にこれらを代入すると: $$ \begin{aligned} r_{x'y'} &= \frac{s_{x'y'}}{s_{x'}s_{y'}} \\[10pt] &= \frac{acs_{xy}}{|a|s_x \cdot |c|s_y} \\[10pt] &= \frac{ac}{|a||c|} \cdot \frac{s_{xy}}{s_x s_y} \end{aligned} $$

§結論

$|a||c| = |ac|$ であるから, 変換後の相関係数は次のようになる。 $$ r_{x'y'} = \frac{ac}{|ac|} r_{xy} $$

【補足:符号の意味】
・$ac > 0$(同符号)のとき:$r_{x'y'} = r_{xy}$ (不変)
・$ac < 0$(異符号)のとき:$r_{x'y'} = -r_{xy}$ (符号が反転)
たとえば, $x=[1, 2, 3]$ のとき, $y=2x+1$ と変形すると, $x'=[3, 5, 7]$ になります。
$y=[2, 4, 6]$ のとき, $y'=-x+2$ と変形すると, $y'=[0, -2, -4]$ になります。

$\displaystyle r_{x'y'}=-1$, $\displaystyle r_{xy}=1$ なので, $\displaystyle r_{x'y'}=\frac{2 \cdot (-1)}{|2| \cdot |-1|} r_{xy}$ が成り立っています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です