【理解】確率分布(離散型)の数学的解説

確率分布と確率変数について

確率分布

値 $X$$x_1$$\cdots$$x_n$
確率 $P$$p_1$$\cdots$$p_n$$1$

[custom_content_widget post_id="39828"]

$X$ を確率変数といいます。

$P(X=x_i) = p_i$ $(1 \leqq i \leqq n)$ という書き方をします。

Probability…確率

確率変数の統計量について

期待値$E[X]$, 分散 $V[X]$, 標準偏差 $\sigma[X]$ の定義を整理しましょう。

$E[X] = x_1p_1 + \cdots + x_np_n$

[custom_content_widget post_id="36794"]

$V[X] = (x_1-\mu)^2p_1 + \cdots + (x_n-\mu)^2p_n$

[custom_content_widget post_id="39844"]

$\sigma[X] = \sqrt{V[X]}$

[custom_content_widget post_id="39855"]

Column. 期待値と平均値の違い

[custom_content_widget post_id="33537" downcase_headings="true"]

$V[X] = E[X^2]-E[X]^2$

[custom_content_widget post_id="40208"]

確率変数の変換について

確率変数 $X$ を, $aX+b$ と変換したときの期待値, 分散, 標準偏差の公式を整理します。

$E[aX+b] = aE[X]+b$

[custom_content_widget post_id="40128"]

$V[aX+b] = a^2V[X]$

[custom_content_widget post_id="40154"]

$\sigma[aX+b] = |a| \sigma[X]$

[custom_content_widget post_id="40170"]

【事例】確率分布の事例について

ベルヌーイ分布 $B(1,p)$

[custom_content_widget post_id="36837"]

二項分布 $B(n,p)$

[custom_content_widget post_id="36850"]

ゴルトンボード(Memo)

後日、記載予定。

連続的な確率分布(Memo)

確率分布記号決定量特徴量検定推定量簡単な導出
正規分布$N(\mu, \sigma^2)$平均値,分散$E(X) = \mu$
$V(X) = \sigma^2$
標本平均$\bar{X}$(の母分散による標準化)$$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$$
t分布$t(k)$自由度 $k$(サンプル数-1)$E(X) = 0$
$V(X) = \frac{k}{k-2}$
標本平均の不偏分散による標準化 $T$$$\frac{\bar{X} - \mu}{s/\sqrt{n}}$$
カイ2乗分布$\chi^2(k)$自由度 $k$$E(X) = k$
$V(X) = 2k$
不偏分散 $s^2$の線型倍$\sum_{i=1}^kZ_i^2$
$Z_i \sim N(0,1)$
$Z_i = \frac{X_i-\bar{X}}{\sigma}$
F分布$F(p,q)$自由度 $p$, $q$$E(X) = \frac{q}{q-2}$
$V(X)$ は複雑
不偏標準偏差の比
分散分析にも利用される
$\frac{Z_1/p}{Z_2/q}$
$Z_1 \sim \chi(p)$
$Z_2 \sim \chi(q)$

まとめノート

「確率分布(離散型)」とは

離散的に起こる事象その確率の分布を表現したもののこと。

確率分布

出現する値が $\{ x_1, \ldots, x_n \}$ であり, 各 $x_i$ が起こる

確率が $p_i \in [0,1]$ $(p_1+\cdots +p_n=1)$

であることを, $P(x_i) = p_i$ とかく.

確率変数

確率の関数 $P$ の変数を確率変数

といい, 変数の定義域は $\{ x_1, \ldots, x_n \}$ である. 以下, $X$ をこの確率分布に従う確率変数とする.

A. 期待値 $E[X]$

$\displaystyle E[X] = \sum_{i=1}^n x_i p_i$

B. 分散 $V[X]$ と標準偏差 $\sigma[X]$

  1. $\displaystyle V[X] =\sum_{i=1}^n (x_i - m)^2p_i$ $=E[(X-m)^2]$ $= E[X^2] - E[X]^2$
  2. $\displaystyle \sigma[X] = \sqrt{V[X]}$

確率変数の変換

関数 $f$ で 新しい確率変数

$Y=f(X)$

が定義できる. ただし, 確率関数 $P$ は

$P(f(x_i)) = p_i$

を満たすように改めて定義する.

C. 一次変換による変数変換

$Y=aX+b$ ならば $E[Y] = aE[X]+b$, $V[Y] = a^2V[X]$.

ポイント解説

記号

確率変数 $X$ が確率分布 $D$ に従うこと

を $X \sim D$ とかく。

確率分布

ヒストグラム等で可視化;

A

期待値は確率分布の中心を表す。

B

$m=E[X]$ とした。分散と標準偏差は確率分布の散らばりを表す。

確率変数の変換

$y_i = f(x_i)$ のとき, $P(y_i) = P(x_i) = p_i$ であり, 変数変換しても確率の値は変えないことに注意する。

C

$y_i = a x_i +b$ として $E[Y]$ と $V[Y]$ を計算することで導出できる。

発展

確率(分布)はコルモゴロフの公理で定義する:

  1. 各事象から確率を定める関数がある
  2. 全ての事象の確率は $1$ である
  3. 互いに排反な事象全体の確率は各事象の確率の和である(加算加法性)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です