データの一次変換による共分散の変化

データ $x$ と $y$ のそれぞれの各値を $x'=ax+b$, $y'=cy+d$ によって変換したあとのデータの共分散 $s_{x'y'}$ が $acs_{xy}$ であることを示してみよう。
命題(一次変換による共分散の変化)

データ $x, y$ の共分散を $s_{xy}$ とする。 各データを $x'_k = ax_k + b$, $y'_k = cy_k + d$ と変換したときの共分散 $s_{x'y'}$ は, 次のようになる。 $$ s_{x'y'} = acs_{xy} $$

$x, y$ の平均値を $\bar{x}, \bar{y}$ とする。変換後のデータの平均値は次のように表される。 $$ \bar{x'} = a\bar{x} + b, \quad \bar{y'} = c\bar{y} + d $$

§偏差の計算

各データの偏差を求めると, 定数項 $b, d$ が相殺される。 $$ \begin{aligned} x_k' - \bar{x'} &= (ax_k + b) - (a\bar{x} + b) = a(x_k - \bar{x}) \\[5pt] y_k' - \bar{y'} &= (cy_k + d) - (c\bar{y} + d) = c(y_k - \bar{y}) \end{aligned} $$

§共分散の定義式の計算

$s_{x'y'}$ の定義式に上の結果を代入し, $ac$ を共通因数として括りだす。 $$ \begin{aligned} s_{x'y'} &= \frac{(x_1'-\bar{x'})(y_1'-\bar{y'}) + \cdots + (x_n'-\bar{x'})(y_n'-\bar{y'})}{n} \\[10pt] &= \frac{a(x_1-\bar{x}) \cdot c(y_1-\bar{y}) + \cdots + a(x_n-\bar{x}) \cdot c(y_n-\bar{y})}{n} \\[10pt] &= \frac{ac \left\{ (x_1-\bar{x})(y_1-\bar{y}) + \cdots + (x_n-\bar{x})(y_n-\bar{y}) \right\}}{n} \\[10pt] \end{aligned} $$

§結論

右辺の和の形は元の共分散 $s_{xy}$ そのものであるから, 次が成り立つ。 $$ s_{x'y'} = acs_{xy} $$

たとえば, $x=[1, 2, 3]$ のとき, $y=2x+1$ と変形すると, $x'=[3, 5, 7]$ になります。
$y=[2, 4, 6]$ のとき, $y'=-x+2$ と変形すると, $y'=[0, -2, -4]$ になります。

$\displaystyle s_{xy}=\frac{4}{3}$, $\displaystyle s_{x'y'}=-\frac{8}{3}$ なので, $s_{x'y'}=2 \cdot (-1) \cdot s_{xy}$ が成り立っています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です