定義
変動係数の定義

定義(変動係数) データの標準偏差を平均値で割った値を変動係数という. データ $x$ の標準偏差を $s_x$, 平均値を $\bar{x}$ とすると, 変動係数 $CV$ は $\displaystyle CV = […]

続きを読む
立式
尺度水準による代表値の利用の可否

外れ値の代表値への影響 尺度水準 適切な代表値 備考 名義尺度(Nominal) 最頻値 平均値・中央値は意味を持たない。 順序尺度(Ordinal) 中央値、最頻値 平均値は間隔が等しい場合のみ参考程度に用いる。 間隔 […]

続きを読む
定義
トリム平均の定義

定義(トリム平均) $m$ 個ずつを取り除くトリム平均とは, データから大きい方の値と小さい方の値をそれぞれ $m$ 個ずつ取り除いたデータの平均値のことである. 小さいものから順番に並べたデータ $[x_1, \ldo […]

続きを読む
定義
移動平均の定義

定義(単純移動平均) 時系列データ $[x_1, \ldots, x_n]$ について, $m$ 項の移動平均とは, $t \geq m$ について, $\displaystyle \frac{x_t + x_{t-1} […]

続きを読む
立式
外れ値の代表値への影響

外れ値の代表値への影響 項目 平均値への影響 中央値への影響 その他の代表値 備考 外れ値なし 平均も中央値もほぼ同じ値になる 平均とほぼ一致 最頻値なども代表値として安定 データが対称分布に近い場合は差が小さい 外れ値 […]

続きを読む
立式
外れ値の選定(中央値基準)

統計的観点(外れ値) 中央値を基準とする統計分析において, 中央値から四分位範囲が1.5つ分以上離れているデータの値を外れ値と定める. データの中央値を $\tilde{x}$, 四分位範囲を $\mathrm{IQR} […]

続きを読む
立式
外れ値の選定(平均値基準)

統計的観点(外れ値) 平均値を基準とする統計分析において, 平均値から標準偏差が3つ分以上離れているデータの値を外れ値と定める. データの平均値を $\bar{x}$, 標準偏差を $\sigma$ としたとき, $\b […]

続きを読む
定義
データの外れ値の定義

定義(外れ値) 他のデータから大きく離れていて, 全体の分布のパターンから見て異常に見える観測値のことを外れ値という. たとえば, データ $[-1, 0, 2, 3, 99]$ について, $99$ を外れ値と捉えるこ […]

続きを読む
立式
アンスコムの数値例について

数値例(アンスコム) 平均・分散・相関係数といった基本的な統計量がほぼ同一であるにもかかわらず、グラフに描画すると全く異なる性質を持つ4つのデータ群のこと。 観測値/統計量 I_x I_y II_x II_y III_x […]

続きを読む
立式
ヒストグラムの形状と特徴の一覧

ヒストグラムの形状と特徴 名称 意味 特徴 歪度(傾き) 尖度(山の鋭さ) 選ぶ代表値 選定理由 正規分布(ベル型) 平均付近が最も多く、左右対称の典型的な分布。 自然現象や測定値など、多くの現象で現れる。 ≈0(対称) […]

続きを読む