• 目次
  • 理解
  • 表計算
  • コード

【理解】データの散らばりの数学的解説

散布度について

$s_x^2 \displaystyle = \frac{(x_1 - \bar{x})^2+\cdots + (x_n - \bar{x})^2}{n}$(分散)

[custom_content_widget post_id="42725"]

$s_x^2 = \overline{x^2} - \bar{x}^2$

[custom_content_widget post_id="43197"]

$s_x \displaystyle = \sqrt{\frac{(x_1 - \bar{x})^2+\cdots + (x_n - \bar{x})^2}{n}}$(標準偏差)

[custom_content_widget post_id="42720"]

$\displaystyle CV=\frac{s_x}{\bar{x}}$(変動係数)

[custom_content_widget post_id="43762"]

ヒストグラムの形状による分布の比較

[custom_content_widget post_id="43651"]

$s_y^2 = a^2s_x^2$(分散)
$s_y = |a|s_x$(標準偏差)
※一次変換 $y=ax+b$ による変化

[custom_content_widget post_id="43771"]

[custom_content_widget post_id="43784"]

$\displaystyle z = \frac{x-\bar{x}}{s_x}$(標準化)

[custom_content_widget post_id="43790"]

$\displaystyle \frac{x_k - \bar{x}}{s_x}\times 10 +50$(偏差値)

[custom_content_widget post_id="42728"]

$M-m$(データの範囲)

[custom_content_widget post_id="43213"]

$Q_3-Q_1$(四分位範囲)

[custom_content_widget post_id="42742"]

$\displaystyle \frac{Q_3-Q_1}{2}$(四分位偏差)

[custom_content_widget post_id="42747"]

【表計算】Excel・スプレッドシートで散らばりの計算

四分位数 QUARTILE.INC()

[custom_content_widget post_id="43019"]

分散 VAR.P()

[custom_content_widget post_id="43032"]

標準偏差STDEV.P()

[custom_content_widget post_id="43037"]

ヒストグラムの作成

[custom_content_widget post_id="43293"]

箱ひげ図の作成

[custom_content_widget post_id="43303"]

【コード】Pythonで散らばりの計算

四分位数(パーセンタイル) percentile()

[custom_content_widget post_id="43573"]

分散 pvarinace() variance() var()

[custom_content_widget post_id="43559"]

[custom_content_widget post_id="43552"]

標準偏差pstdev() stdev() std()

[custom_content_widget post_id="43563"]

[custom_content_widget post_id="43569"]

ヒストグラムの作成hist()

[custom_content_widget post_id="43456"]

ヒストグラムの複数表示(Pandasの利用)

【CSV/Pandas初めて使う人】PythonでCSVファイルを利用して「あっすごい」って思わせるまで

PythonでCSVファイルを利用する基本的な内容を解説します。 Pythonを使うと任意のデータを利用することも容易になります。 初歩的なことしか知らないと、 「Excelの方が便…

箱ひげ図の作成boxplot()

[custom_content_widget post_id="43437"]

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です