- 目次
- 理解
- 事例
- まとめ
【理解】データの尺度水準の解説
質的データ
数値はラベルであり,数値自体に意味はないデータのことです。
名義尺度と順序尺度が質的データに対応します。
量的データ
数値で定義され, 数値自体に意味があるデータのことです。
間隔尺度と比例尺度が質的データに対応します。
★データ尺度水準(解説動画)
名義尺度
カテゴリー分けできるデータの水準である。
順序尺度
名義尺度であって、カテゴリーに順序付けできるデータの水準である。
間隔尺度
順序尺度であって、順序の間隔が定義できて, 等間隔であるデータの水準である。
比例尺度
間隔尺度であって、絶対零点があるデータの水準である。
【整理】尺度水準と定義条件
条件 | 区分性 | 順序性 | 等間隔性 | 絶対零点 |
名義 | ◯ | |||
順序 | ◯ | ◯ | ||
間隔 | ◯ | ◯ | ◯ | |
比例 | ◯ | ◯ | ◯ | ◯ |
【整理】尺度水準と加減乗除の可否
演算 | 名義 | 順序 | 間隔 | 比例 |
大小比較 | × | ◯ | ◯ | ◯ |
加減 | × | × | ◯ | ◯ |
乗除 | × | × | × | ◯ |
【事例】データの尺度水準の具体例
名義尺度の事例
・血液型
・性別
・郵便番号
順序尺度の事例
・3つ星レストランなどの3段階評価や5段階評価
・学年
間隔尺度の事例
・西暦
・偏差値
・摂氏 $({}^\circ \mathrm{C})$
比例尺度の事例
・身長
・体重
・時間
・絶対温度 $(\mathrm{K})$
まとめノート
「データの尺度水準」とは
利用可能な統計処理かを判断できるデータの性質の区分のこと。
質的データ
数値はラベルであり,
数値自体に意味はないデータ
のこと.
量的データ
数値で定義され,
数値自体に意味があるデータ
のこと.
A. データの尺度水準
- 名義尺度:カテゴリー分けできるデータの水準である
- 順序尺度:(1)&カテゴリーに順序付けできるデータの水準である
- 間隔尺度:(2)&順序の間隔が定義でき, 等間隔であるデータの水準である
- 比例尺度:(3)&絶対零点があるデータの水準である
B. 尺度水準別のデータの演算の取り扱い
- 比例尺度は加減乗除の計算すべてに意味がある
- 間隔尺度は比例計算(乗除)の計算に意味がない
- 質的データでは四則演算のいずれも意味がない
C. 代表値・分析手法と尺度水準
- 名義尺度のデータは集計表などで整理し, 代表値は最頻値を利用する
- 順序尺度では箱ひげ図が利用でき, 代表値は中央値も利用できる
- 量的データには平均値も利用でき, ヒストグラムや相関なども利用できる
ポイント解説
質的データ
名義尺度と順序尺度
量的データ
間隔尺度と比例尺度
A
各尺度の違い
を例で説明する:
- 血液型(1.A型, 2.B型, ・・・)の数値比較(1<2)はできない. 順序尺度ではない.
- 体調の「1.よい・2.ふつう・3.わるい」の数値は比較できるが, 間隔は定義できない. 間隔尺度ではない.
- 西暦は1年間隔の「時」を表すが, 西暦0年は「時が無い」という絶対的なゼロではない. 比例尺度ではない.
- 年齢の「0歳」は産まれたばかりで重ねた歳がないという絶対的なゼロを表す. 比例尺度である.
B
計算の意味の有無
を例で説明する:
- 比例尺度の年齢では+1は1歳上, ×2は年の差が2倍など四則に意味がある.
- 間隔尺度の西暦ではBC100の2倍はBC200だが「時」が2倍減った訳ではなく意味がない.
- 順序尺度のデータでは 1(よい)+2(ふつう)=3(わるい)には意味がない.
発展
下位水準のデータを
上位の尺度水準と捉え
分析の幅を広げることもある.