データの一次変換による分散の変化
データ $x$ の各値を $y=ax+b$ によって変換したあとのデータの分散 $s_{y}^2$ が $s_{y}^2 = a^2s_{x}^2$ であることを示してみよう。
性質
データ $x=[x_1, x_2, \cdots, x_n]$ について, 分散を $s_{x}^2$ とする.
データ $x$ の各値 $x_k$ $(1 \leq k \leq n)$ を $y_k=ax_k + b$ と変換したあとのデータを $y$ とする. データ $y$ の分散を $s_y^2$ とする.
このとき, $s_y^2 = a^2s_x^2$ が成り立つ.
証明.
$x$ と $y$ の平均値を $\bar{x}$ と $\bar{y}$ とする.
$\bar{y} = a\bar{x} + b$
データ $y$ の分散の定義式を計算するために $y_k$ の偏差を求めると,
$y_k-\bar{y}$ $=(ax_k+b)-(a\bar{x}+b)$ $=a(x_k-\bar{x})$
である.
$s_y^2$
$\displaystyle =\frac{(y_1-\bar{y})^2 + \cdots + (y_n-\bar{y})^2}{n}$
$\displaystyle =\frac{a^2(x_1-\bar{x})^2 + \cdots + a^2(x_n-\bar{x})^2}{n}$
$\displaystyle =a^2\frac{(x_1-\bar{x})^2 + \cdots + (x_n-\bar{x})^2}{n}$
$=a^2s_x^2$.
ゆえに, $s_y^2 = a^2s_x^2$ が得られた.
たとえば,
$x=[1, 2, 3]$
のとき, $y=2x+1$ と変形すると,
$y=[3, 5, 7]$
になります。
$\displaystyle s_x^2=\frac{2}{3}$,
$\displaystyle s_y^2=\frac{8}{3}$
なので,
$s_y^2=2^2 \times s_x^2$
が成り立っています。