- 目次
- 理解
- コード
- まとめ
【理解】二項分布とは
ベルヌーイ分布・二項分布について
ベルヌーイ分布 $B(1,p)$
ベルヌーイ分布 $B(1,p)$ の定義
( $0 \leqq p \leqq1$ は成功確率)
定義(ベルヌーイ分布)
ベルヌーイ分布は, ベルヌーイ試行によって定義される確率分布です。
ベルヌーイ試行とは, 成功確率が $p$ である試行を1回行い, 成功の場合「1」, 失敗の場合「0」と定める試行です。
結果 | $0$ | $1$ | 計 |
確率 | $1-p$ | $p$ | $1$ |
定義(ベルヌーイ分布の確率変数)
ベルヌーイ分布の確率変数 $X$ は $$\begin{aligned}P(X=0) &= 1-p \\ P(X=1) &= p \end{aligned}$$ で定まる確率変数です。$P$ は確率を定める関数です。
$X$ | $0$ | $1$ | 計 |
確率 | $1-p$ | $p$ | $1$ |
表が出たら「1」, 裏が出たら「0」であるコイントスはベルヌーイ試行です。
公正なコインの場合 $B(1, 0.5)$ です。表が出る確率が $0.2$ の偏ったコインでは $B(1, 0.2)$ です。
期待値 $E[X]=p$
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の期待値が $E[X] = p$ であることを証明してみよう。
ベルヌーイ分布の期待値
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の期待値について
$E[X] = p$
証明.
期待値の定義通りに計算する.
$\begin{aligned}
E[X] &= \displaystyle 1 \cdot p + 0 \cdot (1-p) \\
&= \displaystyle p.
\end{aligned}$
確率分布 $S$ に従う確率変数 $X$ の期待値は次の通り: $$\displaystyle E[X] = \sum_{i=1}^n x_i p_i.$$
$X$ | $x_1$ | $\cdots$ | $x_n$ | 計 |
確率 | $p_1$ | $\cdots$ | $p_n$ | $1$ |
ゆえに, $E[X] = p$ である.
例えば, 成功確率が $0.3$ のベルヌーイ分布 $B(1,0.3)$ では,
$Y$ | $1$ | $0$ | 計 |
確率 | $0.3$ | $0.7$ | $1$ |
期待値 $E[X]$ $= 1 \cdot 0.3$ $+ 0 \cdot 0.7$ $= 0.3$
です。
分散 $V[X]=p(1-p)$
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の分散が $V[X] = p(1-p)$ であることを証明してみよう。
ベルヌーイ分布の分散
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の分散について
$V[X] = p(1-p)$
証明.
確率変数の分散の定義通りに計算する.
ベルヌーイ分布の期待値は $E[X] = p$ である.
分散については
$$\begin{aligned}
V[X] &= \displaystyle (1-p)^2 \cdot p + (0-p)^2 \cdot (1-p) \\
&= \displaystyle p(1-p)
\end{aligned}$$
確率変数 $X$ の分散は: $V[X]$ $\displaystyle = \sum_{i=1}^n (x_i-E[X])^2 p_i $
$X$ | $x_1$ | $\cdots$ | $x_n$ | 計 |
確率 | $p_1$ | $\cdots$ | $p_n$ | $1$ |
である.
ゆえに, $V[X] = p(1-p)$ である.
例えば, 成功確率が $p=0.3$ のベルヌーイ分布 $B(1,0.3)$
$Y$ | $1$ | $0$ | 計 |
確率 | $0.3$ | $0.7$ | $1$ |
について, 分散は
$V[X]$ $=1 \cdot 0.3$ $+ 0 \cdot 0.7$ $= 0.3$
です。
標準偏差 $\sigma[X]=\sqrt{p(1-p})$
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の標準偏差 $\sigma[X] = \sqrt{p(1-p)}$ であることを証明してみよう。
ベルヌーイ分布の標準偏差
ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の標準偏差について
$\sigma[X] = \sqrt{X(1-p)}$
証明.
標準偏差の定義通りに計算する.
ベルヌーイ分布の分散は $V[X] = p(1-p)$ である.
標準偏差は, $\sigma[X] = \sqrt{V[X]}$ であったから,
$\sigma[X] = \sqrt{p(1-p)}$
である.
例えば, 成功確率が $p=0.3$ のベルヌーイ分布 $B(1,0.3)$
$Y$ | $1$ | $0$ | 計 |
確率 | $0.3$ | $0.7$ | $1$ |
について, $V[X] = 0.21$ なので,
$\sigma[X] = \sqrt{0.21} \fallingdotseq 0.46 $ です。
二項分布 $B(n,p)$
二項分布 $B(n,p)$ の定義
$P(X=r) = {}_n \mathrm{C}_rp^r(1-p)^{n-r}$
定義(二項分布)
二項分布 $B(n,p)$ は成功確率が $p$ の反復試行を $n$ 回行ったときの成功回数についての確率分布である。
二項分布
$0 \leqq r \leqq n$ とする。$n$ 回の試行のうち, $r$ 回成功する確率は $${}_n \mathrm{C}_rp^r(1-p)^{n-r}$$ であり, 確率分布表は次の通り。
回数 | 確率 |
---|---|
$0$ | $(1-p)^n$ |
$1$ | ${}_n \mathrm{C}_1p(1-p)^{n-1}$ |
$2$ | ${}_n \mathrm{C}_2p^2(1-p)^{n-2}$ |
$\vdots$ | $\vdots$ |
$n-1$ | ${}_n \mathrm{C}_{n-1}p^{n-1}(1-p)$ |
$n$ | $p^n$ |
合計 | $1$ |
10回コイントスをしたときの表の回数は二項分布
$\displaystyle B\left(10, \frac{1}{2} \right)$
です。
サイコロを5回転がしたときの5以上の目が出る回数は
$\displaystyle B \left(5, \frac{1}{3} \right)$
です。
※二項分布(英:Binomial distribution)
$X_1, \ldots , X_n \sim B(1,p)$ ならば $X_1 + \ldots +X_n \sim B(n,p)$
(ベルヌーイ試行を $n$ 回繰り返すと二項分布 $B(n,p)$ )
命題
ベルヌーイ分布 $B(1,p)$ に従う $n$ 個の独立な確率変数を $X_1$ $\ldots$ $X_n$ とする.
確率変数の和 $X_1 + \ldots + X_n$ は二項分布 $B(n,p)$ に従う.
逆に, 二項分布に従う確率変数 $X$ は, $n$ 個の独立なベルヌーイ分布に従う確率変数の和として表すことができる.
$X=X_1 + \ldots + X_n$.
※ $0 \leqq r \leqq n$ について, $P(X_1 + \ldots + X_n = r)$ $={}_n\mathrm{C}_rp^r(1-p)^{n-r}$ である.
証明.
ベルヌーイ分布 $B(1,p)$ に従う独立な確率変数 $X_1$ $\ldots$ $X_n$ の和 $X_1 + \ldots + X_n$ と, 二項分布 $B(n,p)$ に従う確率変数 $X$ が等しいことを示す.
ベルヌーイ分布に従う確率分布
$X_r$ | $0$ | $1$ | 計 |
確率 | $1-p$ | $p$ | $1$ |
■ 確率変数の和が二項分布に従うこと;
$1 \leqq r \leqq n$ について, $X_1 + \ldots + X_n=r$ とする. この方程式の解は
$(X_1,\ldots, X_r, X_{r+1}, \ldots, X_n)$ $=(1, \cdots, 1, 0, \cdots, 0)$
をはじめ, $n$ 個のうち $r$ 個の確率変数が $1$ を返している状況を表す. これらの解は ${}_n \mathrm{C}_r$ 個だけ存在して, おのおのが起こる確率は確率変数の独立性より $p^r(1-p)^{n-r}$ である.
ゆえに,
$P(X_1 + \ldots + X_n=r)$ $={}_n \mathrm{C}_r p^r(1-p)^{n-r}$
であり, この確率変数は二項分布 $B(n,p)$ に従っていることが分かる.
■ 二項分布に従う確率変数がベルヌーイ分布に従う確率変数の和で表せること;
$1 \leqq i \leqq n$ について, $n$ 回の試行のうち, $i$ 回目の試行の成功の可否を表す確率変数 $X_i$ を
・成功した場合 $X_i=1$,
・失敗した場合 $X_i = 0$
と定める. これは $B(1,p)$ に従う確率変数である.
$1 \leqq i,j \leqq n$ について, 二項分布の $i$ 回目の試行と $j$ 回目の試行は互いに影響しないので, $X_i$ と $X_j$ は独立である.
これらの和 $X_1 + \ldots + X_n$ は前述の通り, $B(n,p)$ に従う確率変数となる..
ゆえに, $B(n,p)$ に従う確率変数 $X$ は, $n$ 個の独立なベルヌーイ分布に従う確率変数の和として表すことができる.
例えば, $n=2$ のとき
$X_1, X_2$ | $0$ | $1$ | 計 |
$0$ | $(1-p)^2$ | $(1-p)p$ | $1-p$ |
$1$ | $p(1-p)$ | $p^2$ | $p$ |
計 | $1-p$ | $p$ | $1$ |
$X_1 + X_2=2$ のときは, $(X_1, X_2)$ $=(1,1)$ のときのみであり確率は $p^2$ である。
$X_1 + X_2=1$ のときは, $(X_1, X_2)$ $=(1,0)$, $(0,1)$ であるから確率は $2p(1-p)$ である。
$X_1 + X_2=0$ のときは, $(X_1, X_2)$ $=(0,0)$ のときのみであり確率は $(1-p)^2$ である。
したがって, $X_1 + X_2$ は二項分布 $B(2,p)$ に従っています。
期待値 $E[X]=np$
二項分布 $B(n,p)$ に従う確率変数 $X$ の期待値が $E[X] = np$ であることを証明してみよう。
公式
二項分布 $B(n,p)$ に従う確率変数 $X$ について,
$E[X] = np$
証明.
二項分布 $B(n,p)$ に従う確率変数 $X$ は, ベルヌーイ分布 $B(1,p)$ に従う $n$ 個の独立な確率変数 $X_1$, $\ldots$, $X_n$ の和で表すことができる:
$$X = X_1 + \cdots + X_n.$$
$1 \leqq i \leqq n$ について, $i$ 回目の試行が成功した場合 $X_i=1$, 失敗した場合 $X_i = 0$ と定める.
例えば, $X=n$ であった場合, 全ての $i$ で $X_i=1$ であるから $X_1 + \cdots +X_n = n$ となり $X=n$ と一致する. また, $X=2$ である場合, $X_1$ から $X_n$ のうち2個は, 成功したときに対応するもので, その値は $1$ である. 他のものの値は $0$ となるため, $X_1 + \cdots + X_n = 2$ で $X=2$ に一致する.
任意の添え字 $i$ について $E[X_i] = p$ である.
確率変数 $X_i$ はベルヌーイ分布 $B(1,p)$ に従うとき, $E[X_i] = p$ である.
$\begin{aligned}
E[X] &= E [X_1 + \ldots + X_n ] \\
&= E[X_1]+ \ldots + E[X_n] \\
&= p + \cdots + p \\
&= np.
\end{aligned}$
独立な確率変数 $X$ と $Y$ について $E[X+Y] = E[X] + E[Y]$ である.
ゆえに, $E[X] = np$ である.
例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行う確率分布です。
1回試行した結果の期待値は $0.3$ で, $10$ 回試行した結果の期待値は
$E[X]$ $= 0.3 \times 10$ $= 3$
です。
分散 $V[X]=np(1-p)$
二項分布 $B(n,p)$ に従う確率変数 $X$ の分散が $V[X] = np(1-p)$ であることを証明してみよう。
二項分布の分散
二項分布 $B(n,p)$ に従う確率変数 $X$ について,
$V[X]=np(1-p)$
証明.
二項分布 $B(n,p)$ に従う確率変数 $X$ は, ベルヌーイ分布 $B(1,p)$ に従う $n$ 個の独立な確率変数 $X_1$, $\ldots$, $X_n$ の和で表すことができる.
$$X = X_1 + \cdots + X_n.$$
$1 \leqq i \leqq n$ について, $i$ 回目の試行が成功した場合 $X_i=1$, 失敗した場合 $X_i = 0$ と定める.
例えば, $X=n$ であった場合, 全ての $i$ で $X_i=1$ であるから $X_1 + \cdots +X_n = n$ となり $X=n$ と一致する. また, $X=2$ である場合, $X_1$ から $X_n$ のうち2個は, 成功したときに対応するもので, その値は $1$ である. 他のものの値は $0$ となるため, $X_1 + \cdots + X_n = 2$ で $X=2$ に一致する.
任意の添え字 $i$ について, $X_i$ はベルヌーイ分布 $B(1,p)$ に従う確率変数なので $V[X_i] = p(1-p)$ である.
$\begin{aligned}
V[X] &= V [X_1 + \ldots + X_n ] \\
&= V[X_1]+ \ldots + V[X_n] \\
&= p(1-p) + \cdots + p(1-p) \\
&= np(1-p).
\end{aligned}$
独立な確率変数 $X$ と $Y$ について $V[X+Y] = V[X] + V[Y]$ である.
ゆえに, $V[X] = np(1-p)$ である.
例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行った結果の確率分布です。
1回試行した結果の分散は $0.21$ です。
$10$ 回試行した結果の分散は
$V[X]$ $= 0.21 \times 10$ $= 2.1$
です。
標準偏差 $\sigma[X]=\sqrt{np(1-p})$
二項分布 $B(n,p)$ に従う確率変数 $X$ の標準偏差が $\sigma[X] = \sqrt{np(1-p)}$ であることを証明してみよう。
二項分布の標準偏差
二項分布 $B(n,p)$ に従う確率変数 $X$ について,
$\sigma[X]=\sqrt{np(1-p)}$
証明.
二項分布 $B(n,p)$ に従う確率変数 $X$ の分散は
$V[X] = np(1-p)$
であった.
ゆえに, 標準偏差について $\sigma[X] = \sqrt{np(1-p)}$ である.
例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行った結果の確率分布です。
分散は $V[X] = 2.1$ です。
標準偏差は $\sigma[X] = \sqrt{2.1}$ です。
二項分布の事例について
メレ氏の賭博 $B(24, 1/36)$
2個のサイコロを24回振るとき, 6のゾロ目が少なくとも1回出るかどうかに賭けるか否かという問題。
シュパリエ・ド・メレ氏はこの賭博に失敗した。
ゴルトンボード
準備中です。
すみません。
【コード】Pythonで二項分布を表示
二項分布のヒストグラムの表示
二項分布 $B(n,p)$ のヒストグラムをPythonで出力してみよう。
二項分布の出力
試行回数n
と成功確率p
によって二項分布 $B(n,p)$ を定める.
scipy.stats
のbinom.pmf()
によって, 二項分布のそれぞれの確率を計算する.
matplotlib.pyplot
で棒グラフ.bar
を描くことでヒストグラムを作成する.
Pythonコード.
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
# 二項分布の情報
n = 100 # 試行回数
p = 0.3 # 成功確率
# 二項分布を表示
x_values = np.arange(0, n + 1)
binomial_probs = binom.pmf(x_values, n, p)
plt.bar(x_values, binomial_probs, color='y', alpha=0.7, label = "Binomial-distribution")
# グラフの表示
plt.legend() #凡例表示
plt.xlabel("Number of Successes")
plt.ylabel("Probability")
plt.title(f"Binomial Distribution (n={n}, p={p})")
plt.grid(True)
plt.show()

二項分布の形状の比較


まとめノート
「二項分布」とは
硬貨を何枚か同時に投げて表が出る回数を表す確率分布のこと。
記号
試行回数 $n$, 確率 $p$ の二項分布を
$B(n, p)$
と書く.
A. 二項分布の確率分布
確率 $p$ の事象が $k$ 回起こる確率は次の通り:$$P(X=k) = {}_n \mathrm{C}_k \cdot p^k \cdot (1-p)^{n-k}$$
B. ベルヌーイ分布
$0$ か $1$ が起こることをベルヌーイ試行という. ベルヌーイ分布は $B(1,p)$ であり, 確率変数を $Y$ とすれば, 期待値 $E[Y] = p$, 分散 $V[Y]=p(1-p)$ である.
C. 期待値と分散
①$E(X) = np$
②$V(X) =np(1-p)$
D. 二項分布の正規分布近似
二項分布 $B(n,p)$ は $n$ が大きいとき, 正規分布 $N(np, np(1-p))$ に近似できる.
ポイント解説
A
確率分布は $0 \sim n$ の範囲で,
$np$ 周辺でピークの山型のヒストグラム
になる.


B
ベルヌーイ試行の確率分布:
$Y$ | $1$ | $0$ | 計 |
$P(Y)$ | $p$ | $1-p$ | $1$ |
ベルヌーイ分布に従う確率変数の和 $X=Y_1 + \cdots + Y_n$ は $B(n,p)$ に従う.
C
$P(X=k)$ の確率分布から直接証明する, もしくはベルヌーイ試行の繰り返しで証明する.
Excel
4つの引数を入力;
BINOM.DIST(成功回数 $k$, 試行回数 $n$, 成功確率 $p$, 関数形式)
※関数形式;TRUE→下側累積確率, FALSE→ $P(X=k)$ の値を出力する.