データの一次変換による分散の変化

データ $x$ の各値を $y=ax+b$ によって変換したあとのデータの分散 $s_{y}^2$ が $s_{y}^2 = a^2s_{x}^2$ であることを示してみよう。

性質

データ $x=[x_1, x_2, \cdots, x_n]$ について, 分散を $s_{x}^2$ とする.

データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $y_k=ax_k + b$ と変換したあとのデータを $y$ とする. データ $y$ の分散を $s_y^2$ とする.

このとき, $s_y^2 = a^2s_x^2$ が成り立つ.

証明.

$x$ と $y$ の平均値を $\bar{x}$ と $\bar{y}$ とする.

$\bar{y} = a\bar{x} + b$

データ $y$ の分散の定義式を計算するために $y_k$ の偏差を求めると,

$y_k-\bar{y}$ $=(ax_k+b)-(a\bar{x}+b)$ $=a(x_k-\bar{x})$

である.

$s_y^2$

$\displaystyle =\frac{(y_1-\bar{y})^2 + \cdots + (y_n-\bar{y})^2}{n}$
$\displaystyle =\frac{a^2(x_1-\bar{x})^2 + \cdots + a^2(x_n-\bar{x})^2}{n}$
$\displaystyle =a^2\frac{(x_1-\bar{x})^2 + \cdots + (x_n-\bar{x})^2}{n}$
$=a^2s_x^2$.

ゆえに, $s_y^2 = a^2s_x^2$ が得られた.

たとえば,

$x=[1, 2, 3]$

のとき, $y=2x+1$ と変形すると,

$y=[3, 5, 7]$

になります。

$\displaystyle s_x^2=\frac{2}{3}$,
$\displaystyle s_y^2=\frac{8}{3}$

なので,

$s_y^2=2^2 \times s_x^2$

が成り立っています。

コメントを残す