立式
尺度水準による代表値の利用の可否

外れ値の代表値への影響 尺度水準 適切な代表値 備考 名義尺度(Nominal) 最頻値 平均値・中央値は意味を持たない。 順序尺度(Ordinal) 中央値、最頻値 平均値は間隔が等しい場合のみ参考程度に用いる。 間隔 […]

続きを読む
定義
トリム平均の定義

定義(トリム平均) $m$ 個ずつを取り除くトリム平均とは, データから大きい方の値と小さい方の値をそれぞれ $m$ 個ずつ取り除いたデータの平均値のことである. 小さいものから順番に並べたデータ $[x_1, \ldo […]

続きを読む
定義
移動平均の定義

定義(単純移動平均) 時系列データ $[x_1, \ldots, x_n]$ について, $m$ 項の移動平均とは, $t \geq m$ について, $\displaystyle \frac{x_t + x_{t-1} […]

続きを読む
立式
外れ値の代表値への影響

外れ値の代表値への影響 項目 平均値への影響 中央値への影響 その他の代表値 備考 外れ値なし 平均も中央値もほぼ同じ値になる 平均とほぼ一致 最頻値なども代表値として安定 データが対称分布に近い場合は差が小さい 外れ値 […]

続きを読む
立式
外れ値の選定(中央値基準)

統計的観点(外れ値) 中央値を基準とする統計分析において, 中央値から四分位範囲が1.5つ分以上離れているデータの値を外れ値と定める. データの中央値を $\tilde{x}$, 四分位範囲を $\mathrm{IQR} […]

続きを読む
立式
外れ値の選定(平均値基準)

統計的観点(外れ値) 平均値を基準とする統計分析において, 平均値から標準偏差が3つ分以上離れているデータの値を外れ値と定める. データの平均値を $\bar{x}$, 標準偏差を $\sigma$ としたとき, $\b […]

続きを読む
定義
データの外れ値の定義

定義(外れ値) 他のデータから大きく離れていて, 全体の分布のパターンから見て異常に見える観測値のことを外れ値という. たとえば, データ $[-1, 0, 2, 3, 99]$ について, $99$ を外れ値と捉えるこ […]

続きを読む
立式
アンスコムの数値例について

ヒストグラムの形状と特徴 観測値/統計量 I_x I_y II_x II_y III_x III_y IV_x IV_y 1 10 8.04 10 9.14 10 7.46 8 6.58 2 8 6.95 8 8.14 […]

続きを読む
立式
ヒストグラムの形状と特徴の一覧

ヒストグラムの形状と特徴 名称 意味 特徴 歪度(傾き) 尖度(山の鋭さ) 選ぶ代表値 選定理由 正規分布(ベル型) 平均付近が最も多く、左右対称の典型的な分布。 自然現象や測定値など、多くの現象で現れる。 ≈0(対称) […]

続きを読む
定義
データの相関の定義

定義(相関) 2変量のデータについて, 散布図を描いたとき直線的な傾向があるときに相関があるという. 散布図において, 直線的な傾向がみられないとき無相関(相関がない)という. 定義(相関の正負) 散布図で右上がりの直線 […]

続きを読む