- 目次
- 理解
- 事例
- まとめ
【理解】確率分布(離散型)の数学的解説
確率分布と確率変数について
確率分布
| 値 $X$ | $x_1$ | $\cdots$ | $x_n$ | 計 |
| 確率 $P$ | $p_1$ | $\cdots$ | $p_n$ | $1$ |
[custom_content_widget post_id="39828"]
$X$ を確率変数といいます。
$P(X=x_i) = p_i$ $(1 \leqq i \leqq n)$ という書き方をします。
※Probability…確率
確率変数の統計量について
期待値$E[X]$, 分散 $V[X]$, 標準偏差 $\sigma[X]$ の定義を整理しましょう。
$E[X] = x_1p_1 + \cdots + x_np_n$
[custom_content_widget post_id="36794"]
$V[X] = (x_1-\mu)^2p_1 + \cdots + (x_n-\mu)^2p_n$
[custom_content_widget post_id="39844"]
$\sigma[X] = \sqrt{V[X]}$
[custom_content_widget post_id="39855"]
Column. 期待値と平均値の違い
[custom_content_widget post_id="33537" downcase_headings="true"]
$V[X] = E[X^2]-E[X]^2$
[custom_content_widget post_id="40208"]
確率変数の変換について
確率変数 $X$ を, $aX+b$ と変換したときの期待値, 分散, 標準偏差の公式を整理します。
$E[aX+b] = aE[X]+b$
[custom_content_widget post_id="40128"]
$V[aX+b] = a^2V[X]$
[custom_content_widget post_id="40154"]
$\sigma[aX+b] = |a| \sigma[X]$
[custom_content_widget post_id="40170"]
【事例】確率分布の事例について
ベルヌーイ分布 $B(1,p)$
[custom_content_widget post_id="36837"]
二項分布 $B(n,p)$
[custom_content_widget post_id="36850"]
ゴルトンボード(Memo)
後日、記載予定。
連続的な確率分布(Memo)
| 確率分布 | 記号 | 決定量 | 特徴量 | 検定推定量 | 簡単な導出 |
|---|---|---|---|---|---|
| 正規分布 | $N(\mu, \sigma^2)$ | 平均値,分散 | $E(X) = \mu$ $V(X) = \sigma^2$ | 標本平均$\bar{X}$(の母分散による標準化) | $$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$$ |
| t分布 | $t(k)$ | 自由度 $k$(サンプル数-1) | $E(X) = 0$ $V(X) = \frac{k}{k-2}$ | 標本平均の不偏分散による標準化 $T$ | $$\frac{\bar{X} - \mu}{s/\sqrt{n}}$$ |
| カイ2乗分布 | $\chi^2(k)$ | 自由度 $k$ | $E(X) = k$ $V(X) = 2k$ | 不偏分散 $s^2$の線型倍 | $\sum_{i=1}^kZ_i^2$ $Z_i \sim N(0,1)$ $Z_i = \frac{X_i-\bar{X}}{\sigma}$ |
| F分布 | $F(p,q)$ | 自由度 $p$, $q$ | $E(X) = \frac{q}{q-2}$ $V(X)$ は複雑 | 不偏標準偏差の比 分散分析にも利用される | $\frac{Z_1/p}{Z_2/q}$ $Z_1 \sim \chi(p)$ $Z_2 \sim \chi(q)$ |
まとめノート
「確率分布(離散型)」とは
離散的に起こる事象とその確率の分布を表現したもののこと。
確率分布
出現する値が $\{ x_1, \ldots, x_n \}$ であり, 各 $x_i$ が起こる
確率が $p_i \in [0,1]$ $(p_1+\cdots +p_n=1)$
であることを, $P(x_i) = p_i$ とかく.
確率変数
確率の関数 $P$ の変数を確率変数
といい, 変数の定義域は $\{ x_1, \ldots, x_n \}$ である. 以下, $X$ をこの確率分布に従う確率変数とする.
A. 期待値 $E[X]$
$\displaystyle E[X] = \sum_{i=1}^n x_i p_i$
B. 分散 $V[X]$ と標準偏差 $\sigma[X]$
- $\displaystyle V[X] =\sum_{i=1}^n (x_i - m)^2p_i$ $=E[(X-m)^2]$ $= E[X^2] - E[X]^2$
- $\displaystyle \sigma[X] = \sqrt{V[X]}$
確率変数の変換
関数 $f$ で 新しい確率変数
$Y=f(X)$
が定義できる. ただし, 確率関数 $P$ は
$P(f(x_i)) = p_i$
を満たすように改めて定義する.
C. 一次変換による変数変換
$Y=aX+b$ ならば $E[Y] = aE[X]+b$, $V[Y] = a^2V[X]$.
ポイント解説
記号
確率変数 $X$ が確率分布 $D$ に従うこと
を $X \sim D$ とかく。
確率分布
ヒストグラム等で可視化;

A
期待値は確率分布の中心を表す。
B
$m=E[X]$ とした。分散と標準偏差は確率分布の散らばりを表す。
確率変数の変換
$y_i = f(x_i)$ のとき, $P(y_i) = P(x_i) = p_i$ であり, 変数変換しても確率の値は変えないことに注意する。
C
$y_i = a x_i +b$ として $E[Y]$ と $V[Y]$ を計算することで導出できる。
発展
確率(分布)はコルモゴロフの公理で定義する:
- 各事象から確率を定める関数がある
- 全ての事象の確率は $1$ である
- 互いに排反な事象全体の確率は各事象の確率の和である(加算加法性)


