外れ値の代表値への影響
外れ値の代表値への影響
項目 | 平均値への影響 | 中央値への影響 | その他の代表値 | 備考 |
---|---|---|---|---|
外れ値なし | 平均も中央値もほぼ同じ値になる | 平均とほぼ一致 | 最頻値なども代表値として安定 | データが対称分布に近い場合は差が小さい |
外れ値が1つ高い/低い | 平均値は大きく変動する(外れ値方向に引っ張られる) | 中央値はほとんど変化しない | 最頻値には影響なし | 平均は外れ値に敏感 |
外れ値が複数ある場合 | 平均は非常に大きく影響を受ける | 中央値は外れ値の数が半数未満ならほぼ影響なし | 四分位点やトリム平均などで調整可能 | 外れ値の方向・数によって影響度が異なる |
極端な外れ値 | 平均が実態を反映しにくくなる | 中央値はロバスト(頑健) | 中央値やトリム平均が推奨 | データ分布の把握には中央値が優位 |