尺度水準による代表値の利用の可否
外れ値の代表値への影響 尺度水準 適切な代表値 備考 名義尺度(Nominal) 最頻値 平均値・中央値は意味を持たない。 順序尺度(Ordinal) 中央値、最頻値 平均値は間隔が等しい場合のみ参考程度に用いる。 間隔 […]
外れ値の代表値への影響
外れ値の代表値への影響 項目 平均値への影響 中央値への影響 その他の代表値 備考 外れ値なし 平均も中央値もほぼ同じ値になる 平均とほぼ一致 最頻値なども代表値として安定 データが対称分布に近い場合は差が小さい 外れ値 […]
外れ値の選定(中央値基準)
統計的観点(外れ値) 中央値を基準とする統計分析において, 中央値から四分位範囲が1.5つ分以上離れているデータの値を外れ値と定める. データの中央値を $\tilde{x}$, 四分位範囲を $\mathrm{IQR} […]
外れ値の選定(平均値基準)
統計的観点(外れ値) 平均値を基準とする統計分析において, 平均値から標準偏差が3つ分以上離れているデータの値を外れ値と定める. データの平均値を $\bar{x}$, 標準偏差を $\sigma$ としたとき, $\b […]
データの外れ値の定義
定義(外れ値) 他のデータから大きく離れていて, 全体の分布のパターンから見て異常に見える観測値のことを外れ値という. たとえば, データ $[-1, 0, 2, 3, 99]$ について, $99$ を外れ値と捉えるこ […]
アンスコムの数値例について
ヒストグラムの形状と特徴 観測値/統計量 I_x I_y II_x II_y III_x III_y IV_x IV_y 1 10 8.04 10 9.14 10 7.46 8 6.58 2 8 6.95 8 8.14 […]
ヒストグラムの形状と特徴の一覧
ヒストグラムの形状と特徴 名称 意味 特徴 歪度(傾き) 尖度(山の鋭さ) 選ぶ代表値 選定理由 正規分布(ベル型) 平均付近が最も多く、左右対称の典型的な分布。 自然現象や測定値など、多くの現象で現れる。 ≈0(対称) […]