共分散の定義 $s_{xy}$=$\displaystyle \frac{(x_1 - \bar{x})(y_1-\bar{y})+\cdots + (x_n - \bar{x})(y_n-\bar{y})}{n}$
定義(共分散)
2変量のデータ $x=[x_1, \ldots , x_n]$ と $y=[y_1, \ldots, y_n]$ について,
$s_{xy}$ $\displaystyle = \frac{(x_1 - \bar{x})(y_1-\bar{y})+\cdots + (x_n - \bar{x})(y_n-\bar{y})}{n}$
$\displaystyle = \frac{1}{n} \sum_{k=1}^n (x_k - \bar{x})(y_k-\bar{y})$
を共分散という. ここで, $\bar{x}$ は $\bar{y}$ はそれぞれ $x$ と $y$ の平均値である.
たとえば,
$x=[1, 2, 3]$,
$y=[2,4,6]$
のとき, 共分散は $\frac{4}{3}$ です。
$z=[-2,-4,-6]$ のとき, $x$ と $z$ の共分散は $-\frac{4}{3}$ です。