ヒストグラムの形状と特徴の一覧

ヒストグラムの形状と特徴

名称意味特徴歪度(傾き)尖度(山の鋭さ)選ぶ代表値選定理由
正規分布(ベル型)平均付近が最も多く、左右対称の典型的な分布。自然現象や測定値など、多くの現象で現れる。≈0(対称)≈0(標準的)平均値外れ値が少なく、平均・中央値・最頻値がほぼ一致するため平均値が適切。
一様分布(矩形型)全ての範囲でほぼ同じ頻度を持つ。乱数や等確率事象のモデルとして使用。≈0(対称)負(平坦)平均値または中央値平均と中央値が一致しやすく、どちらを選んでも範囲の中央を表せる。
右偏分布小さい値が多く、大きい値がまれに現れる。所得や寿命などに見られる。高(裾長い)中央値外れ値が平均を引き上げるため、中央値の方が典型的な値を表す。
左偏分布大きい値が多く、小さい値がまれに現れる。簡単すぎる試験の点数分布などに見られる。高(裾長い)中央値外れ値が平均を引き下げるため、中央値が実態を反映しやすい。
二峰型2つのピークを持つ。異なる集団が混ざった分布。季節性や男女差など複数の要因の混合を示す。ほぼ0(対称的な場合)負(平坦)最頻値(複数)平均や中央値だと谷間を示してしまうため、各山の最頻値が適切。
高尖度平均付近に強く集中し、裾が短い分布。外れ値が少なく、測定精度の高い場合に見られる。≈0(対称)正(尖っている)平均値中心集中度が高く、平均値が安定して分布の中心を示す。
低尖度平均付近の集中度が低く、裾が長い分布。外れ値が多く、変動が激しいデータに見られる。≈0(対称)負(平坦)中央値外れ値が多く、分布の値が広く散らばっているため、中央値が適切。
U字型中央が少なく、両端に多い分布。評価が極端に分かれるアンケート結果などに見られる。≈0(対称)負(平坦)最頻値(両端)中央はほぼデータがないため、両端のピーク(最頻値)を代表値とする。

コメントを残す