- 表紙
- まとめ
- 例
- 理解
- コード
数学のまとめノート
「二項分布」とは
硬貨を何枚か同時に投げて表が出る回数を表す確率分布のこと。
記号
試行回数 $n$, 確率 $p$ の二項分布を
$B(n, p)$
と書く.
A. 二項分布の確率分布
確率 $p$ の事象が $k$ 回起こる確率は次の通り:$$P(X=k) = {}_n \mathrm{C}_k \cdot p^k \cdot (1-p)^{n-k}$$
B. ベルヌーイ分布
$0$ か $1$ が起こることをベルヌーイ試行という. ベルヌーイ分布は $B(1,p)$ であり, 確率変数を $Y$ とすれば, 期待値 $E[Y] = p$, 分散 $V[Y]=p(1-p)$ である.
C. 期待値と分散
①$E(X) = np$
②$V(X) =np(1-p)$
D. 二項分布の正規分布近似
二項分布 $B(n,p)$ は $n$ が大きいとき, 正規分布 $N(np, np(1-p))$ に近似できる.
ポイント解説
A
確率分布は $0 \sim n$ の範囲で,
$np$ 周辺でピークの山型のヒストグラム
になる.


B
ベルヌーイ試行の確率分布:
$Y$ | $1$ | $0$ | 計 |
$P(Y)$ | $p$ | $1-p$ | $1$ |
ベルヌーイ分布に従う確率変数の和 $X=Y_1 + \cdots + Y_n$ は $B(n,p)$ に従う.
C
$P(X=k)$ の確率分布から直接証明する, もしくはベルヌーイ試行の繰り返しで証明する.
Excel
4つの引数を入力;
BINOM.DIST(成功回数 $k$, 試行回数 $n$, 成功確率 $p$, 関数形式)
※関数形式;TRUE→下側累積確率, FALSE→ $P(X=k)$ の値を出力する.
二項分布の例
メレ氏の失敗
メレ氏の失敗という $B(24, 1/36)$ の例がある【参考リンク】。
統計量の証明
ベルヌーイ分布 $B(1, p)$ をもとに、二項分布 $B(n,p)$ の期待値と分散を計算します。
$0 \leqq p \leqq1$ は成功確率で、$n$ は試行回数です。
トピック:
- 確率変数 $Y$ は, ベルヌーイ分布に従うとする. 期待値は $E[Y]= p$ であり, 分散は $V[Y] = p(1-p)$ である.
- 確率変数 $X$ は, 二項分布 $B(n, p)$ に従うとする. 期待値は $E[X]= np$ であり, 分散は $V[X] = np(1-p)$ である.
ベルヌーイ分布の理解
ベルヌーイ分布
ベルヌーイ分布は $B(1, p)$ という記号で表します。
ベルヌーイ試行は, 成功確率が $p$ である試行を1回だけ行い, 成功したら「1」, 失敗したら「0」と定めるものです。
$Y$ | $1$ | $0$ | 計 |
確率 | $p$ | $1-p$ | $1$ |
この分布がベルヌーイ分布です。なお、ベルヌーイ試行の確率変数を $Y$ としました。
ベルヌーイ分布の統計量
ベルヌーイ分布も確率分布なので、期待値 $E[Y]$ と分散 $V[Y]$(・標準偏差 $\sigma[Y]$ )が計算できます。
証明すること.
確率変数 $Y$ は, ベルヌーイ分布に従うとする. 期待値は $E[Y]= p$ であり, 分散は $V[Y] = p(1-p)$ である.
証明.
ベルヌーイ分布の期待値
期待値について定義通り計算する:
$\begin{array}{ccl}
E[Y] &=& \displaystyle 1 \cdot p + 0 \cdot (1-p) \\
&=& \displaystyle p.
\end{array}$
ベルヌーイ分布の分散
分散も定義通り計算する.
$\begin{array}{ccl}
V[Y] &=& \displaystyle (1-p)^2 \cdot p + (0-p)^2 \cdot (1-p) \\
&=& \displaystyle p(1-p).
\end{array}$
以上で, ベルヌーイ分布の期待値と分散が計算できた. ■
二項分布の理解
二項分布は $B(n, p)$ という記号で表します。成功確率が $p$ の同じ独立な試行を $n$ 回行ったときに $r$ 回成功するときの確率 ${}_n \mathrm{C}_rp^r(1-p)^{n-r}$ にもとづく分布です。
簡単に言えば、ベルヌーイ試行を何回も行った時の分布が二項分布です。
※二項分布(英:Binomial distribution)
二項分布 $B(n,p)$ に従う確率変数を $X$ とします。
確率変数の関係
もっとも重要なポイントは、二項分布に従う確率変数 $X$ は、$n$ 個のベルヌーイ分布に従う確率変数 $Y_1$, $\ldots$, $Y_n$ の和で表せるということです。
$$X = Y_1 + \cdots + Y_n$$
例えば、$n$ 回すべて成功したとすると、左辺については $X=n$ です。右辺は $Y_1 = 1$, $\cdots$, $Y_n = 1$ なので、$Y_1 + \cdots + Y_n = 1 + \cdots + 1=n$ です。左辺も右辺も成功回数を算出してくれます。
二項分布の統計量
まずは二項分布の期待値 $E[X]$ を計算します。
証明すること.
確率変数 $X$ は, 二項分布 $B(n, p)$ に従うとする. 期待値は $E[X]= np$ であり, 分散は $V[X] = np(1-p)$ である.
証明.
ベルヌーイ分布に従う独立な $n$ 個の確率変数 $Y_1$, $\ldots$, $Y_n$ をとる.
このとき, $X = Y_1 + \cdots + Y_n$ が成り立つ. 任意の添え字 $1 \leqq i \leqq n$ について, $E[Y_i] = p$, $V[Y_i] = 1-p$ である.
二項分布の期待値
期待値の性質を利用して計算する:
$\begin{array}{cl}
E(X) &=& \displaystyle E \left[ \sum_{i=1}^{n} Y_i \right] \\
&=& \displaystyle \sum_{i=1}^{n} E[Y_i] \\
&=& \displaystyle \sum_{i=1}^{n} p \\
&=& np.
\end{array}$
二項分布の分散
分散の性質を利用しながら, 計算する. 分散については確率変数 $A$ と $B$ について, これらが独立ならば $V[A+B]=V[A]+V[B]$ が成り立つ.
$\begin{array}{cl}
V(X) &=& \displaystyle V \left[\sum_{i=1}^{n} Y_i \right] \\
&=& \displaystyle \sum_{i=1}^{n} V[Y_i] \\
&=& \displaystyle \sum_{i=1}^{n} p(1-p) \\
&=& np(1-p).
\end{array}$
以上で, 二項分布の期待値と分散が計算できた. ■
Pythonコード
二項分布を表示するコードを紹介します。
二項分布 $B(n, p)$ の試行回数 $n$ と成功確率 $p$ を変えて、分布の形の違いを観察しました。
二項分布のコード【Python】
二項分布のPythonコード
次のコードを入力すれば、二項分布を表示できます。
「二項分布の情報」の $n$ と $p$ の数値を変えて、任意の二項分布が作成できます。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
from scipy.stats import norm
# 二項分布の情報
n = 100 # Number of trials
p = 0.3 # Probability of success
# 二項分布を表示
x_values = np.arange(0, n + 1)
binomial_probs = binom.pmf(x_values, n, p)
plt.bar(x_values, binomial_probs, color='y', alpha=0.7, label = "Binomial-distribution")
# Other Informations
plt.legend() #凡例表示
plt.xlabel("Number of Successes")
plt.ylabel("Probability")
plt.title(f"Binomial Distribution (n={n}, p={p})")
plt.grid(True)
plt.show()
二項分布の表示結果

【観察】二項分布の試行回数の変更
観察開始(Pythonコード)
試行回数 $n$ を変えて、二項分布 $B(n, 0.3)$ の形状を観察しました。
試行結果
試行回数 $n$ が 1から5までの間の二項分布を並べて観察しましょう。
試行回数が少ないときの二項分布





最後に、試行回数が $n=100$ のとき(再掲)と、$n=1000$ のときの二項分布の形状を掲載します。
$n=100$ の二項分布

$n=1000$ の二項分布

二項分布って、こんなものです!