数学のまとめノート

「二項分布」とは

硬貨を何枚か同時に投げて表が出る回数を表す確率分布のこと。

記号

試行回数 $n$, 確率 $p$ の二項分布

$B(n, p)$

と書く.

A. 二項分布の確率分布

確率 $p$ の事象が $k$ 回起こる確率は次の通り:$$P(X=k) = {}_n \mathrm{C}_k \cdot p^k \cdot (1-p)^{n-k}$$

B. ベルヌーイ分布

$0$ か $1$ が起こることをベルヌーイ試行という. ベルヌーイ分布は $B(1,p)$ であり, 確率変数を $Y$ とすれば, 期待値 $E[Y] = p$, 分散 $V[Y]=p(1-p)$ である.

C. 期待値と分散

①$E(X) = np$

②$V(X) =np(1-p)$

D. 二項分布の正規分布近似

二項分布 $B(n,p)$ は $n$ が大きいとき, 正規分布 $N(np, np(1-p))$ に近似できる.

ポイント解説

A

確率分布は $0 \sim n$ の範囲で,

$np$ 周辺でピークの山型のヒストグラム

になる.

B

ベルヌーイ試行の確率分布:

$Y$$1$$0$
$P(Y)$$p$$1-p$$1$

ベルヌーイ分布に従う確率変数の和 $X=Y_1 + \cdots + Y_n$ は $B(n,p)$ に従う.

C

$P(X=k)$ の確率分布から直接証明する, もしくはベルヌーイ試行の繰り返しで証明する.

Excel

4つの引数を入力;

BINOM.DIST(成功回数 $k$, 試行回数 $n$, 成功確率 $p$, 関数形式)

関数形式;TRUE→下側累積確率, FALSE→ $P(X=k)$ の値を出力する.

二項分布の例

メレ氏の失敗

メレ氏の失敗という $B(24, 1/36)$ の例がある【参考リンク】。

二項分布の数学的解説

このページの説明事項

  • ベルヌーイ分布について
    • ベルヌーイ分布の定義
    • $E[X] = p$
    • $V[X]=p(1-p)$
  • 二項分布について
    • 二項分布分布の定義
    • $E[X] = np$
    • $V[X]=np(1-p)$

ベルヌーイ分布 $B(1, p)$ をもとに、二項分布 $B(n,p)$ の期待値 $E[X]$ と分散 $V[X]$ を計算します。

$0 \leqq p \leqq1$ は成功確率で、$n$ は試行回数です。

ベルヌーイ分布について

ベルヌーイ分布 $B(n,p)$ の定義

ベルヌーイ分布の定義を紹介します。

定義(ベルヌーイ分布)

ベルヌーイ分布は, ベルヌーイ試行によって定義される確率分布です。

ベルヌーイ試行とは, 成功確率が $p$ である試行を1回行い, 成功の場合「1」, 失敗の場合「0」と定める試行です。

結果$0$$1$
確率$1-p$$p$$1$
確率分布

表が出たら「1」, 裏が出たら「0」であるコイントスはベルヌーイ試行です。公正なコインの場合 $B(1, 0.5)$ です。表が出る確率が $0.2$ の偏ったコインでは $B(1, 0.2)$ です。

定義(ベルヌーイ分布の確率変数)

ベルヌーイ分布の確率変数 $X$ は $$\begin{aligned}P(X=0) &= 1-p \\ P(X=1) &= p \end{aligned}$$ で定まる確率変数です。$P$ は確率を定める関数です。

$X$$0$$1$
確率$1-p$$p$$1$
確率分布

ベルヌーイ分布は確率分布なので、期待値 $E[X]$ と分散 $V[X]$(・標準偏差 $\sigma[X]$ )が計算できます。

ベルヌーイ分布の期待値 $E[X]=p$

ベルヌーイ分布の期待値

$X \sim B(1,p)$ ならば $E[X] = p$ である。

ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の期待値が $E[X] = p$ であることを証明してみよう。

例えば, 成功確率が $0.3$ のベルヌーイ分布 $B(1,0.3)$ では, $E[X] = 0.3$ です。

公式のイメージ

ベルヌーイ分布 $B(1,0.3)$ の期待値は $$E[X] = 1 \cdot 0.3 + 0 \cdot 0.7 = 0.3$$ で求まる!

$Y$$1$$0$
確率$0.3$$0.7$$1$

公式. ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の期待値は $E[X] = p$ である。

期待値の定義通りに計算する。

$$\begin{aligned}
E[X] &= \displaystyle 1 \cdot p + 0 \cdot (1-p) \\
&= \displaystyle p.
\end{aligned}$$

確率分布 $S$ に従う確率変数 $X$ の期待値は次の通り: $$\displaystyle E[X] = \sum_{i=1}^n x_i p_i.$$

$X$$x_1$$\cdots$$x_n$
確率$p_1$$\cdots$$p_n$$1$
確率分布 $S$

ゆえに, $E[Y] = p$ である。

ベルヌーイ分布の分散 $V[X]=p(1-p)$

ベルヌーイ分布の分散・標準偏差

$X \sim B(1,p)$ ならば $V[X] = p(1-p)$ であり, $\sigma[X] = \sqrt{X(1-p)}$ である。

ベルヌーイ分布 $B(1,p)$ に従う確率変数 $Y$ の分散が $V[Y] = p(1-p)$, 標準偏差 $\sigma[Y] = \sqrt{p(1-p)}$ であることを証明してみよう。

例えば, 成功確率が $p=0.3$ のベルヌーイ分布 $B(1,0.3)$ では, $V[Y] = 0.21$, $\sigma[Y] = \sqrt{0.21} \fallingdotseq 0.46 $ です。

公式のイメージ

ベルヌーイ分布 $B(1,0.3)$ の分散は $$V[Y] = 1 \cdot 0.3 + 0 \cdot 0.7 = 0.3$$ で求まる!

$Y$$1$$0$
確率$0.3$$0.7$$1$

公式. ベルヌーイ分布 $B(1,p)$ に従う確率変数 $Y$ の分散は $V[Y] = p(1-p)$, 標準偏差は $\sigma[Y] = \sqrt{p(1-p)}$ である。

分散と標準偏差の定義通りに計算する。

ベルヌーイ分布の期待値は $E[Y] = p$ である。

分散については

$$\begin{aligned}
V[Y] &= \displaystyle (1-p)^2 \cdot p + (0-p)^2 \cdot (1-p) \\
&= \displaystyle p(1-p)
\end{aligned}$$

確率変数 $X$ の分散は: $$V[X] = \sum_{i=1}^n (x_i-E[X])^2 p_i $$

$X$$x_1$$\cdots$$x_n$
確率$p_1$$\cdots$$p_n$$1$
確率分布

である。ゆえに, $V[Y] = p(1-p)$ である。

また, 標準偏差は $\sigma[Y] = \sqrt{p(1-p)}$ である。

確率変数 $X$ の標準偏差は $\sigma[X] = \sqrt{V[X]}$ である。

二項分布について

二項分布は $B(n, p)$ という記号で表します。成功確率が $p$ の同じ独立な試行を $n$ 回行ったときに $r$ 回成功するときの確率 ${}_n \mathrm{C}_rp^r(1-p)^{n-r}$ にもとづく分布です。

簡単に言えば、ベルヌーイ試行を何回も行った時の分布が二項分布です。

※二項分布(英:Binomial distribution)

二項分布 $B(n,p)$ の定義

定義(二項分布)

二項分布 $B(n,p)$ は成功確率が $p$ の反復試行を $n$ 回行ったときの成功回数についての確率分布である。

10回コイントスをしたときの表の回数は二項分布 $\displaystyle B\left(10, \frac{1}{2} \right)$ です。

サイコロを5回転がしたときの5以上の目が出る回数は $\displaystyle B \left(5, \frac{1}{3} \right)$ です。

定義(二項分布の確率変数)

$0 \leqq r \leqq n$ とする。$n$ 回の試行のうち, $r$ 回成功する確率は $${}_n \mathrm{C}_rp^r(1-p)^{n-r}$$ であり, 確率分布表は次の通り。

回数$0$$1$$2$$\cdots$$n$
確率$(1-p)^n$${}_n \mathrm{C}_1p(1-p)^{n-1}$${}_n \mathrm{C}_2p^2(1-p)^{n-2}$$\cdots$$p^n$$1$
確率分布

以下、二項分布 $B(n,p)$ に従う確率変数を $X$ とします。

実は, 期待値は $E[X]= np$ であり, 分散は $V[X] = np(1-p)$ となります. 実際に, 証明をしていきましょう。

二項分布の期待値 $E[X]=np$

公式

$X \sim B(n,p)$ のとき, $E[X] = np$ である。

二項分布 $B(n,p)$ に従う確率変数 $X$ の期待値が $E[X] = np$ であることを証明してみよう。

例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行う確率分布で, 期待値 $E[X] = 3$ です!

公式のイメージ

1回試行した結果の期待値は $0.3$ で, $10$ 回試行した結果の期待値は $$E[X] = 0.3 \times 10 = 3$$ です!

公式. 二項分布 $B(n,p)$ に従う確率変数 $X$ について, 期待値 $E[X]$ は $np$ である。

二項分布 $B(n,p)$ に従う確率変数 $X$ は, ベルヌーイ分布 $B(1,p)$ に従う $n$ 個の独立な確率変数 $X_1$, $\ldots$, $X_n$ の和で表すことができる。

$$X = X_1 + \cdots + X_n$$

$1 \leqq i \leqq n$ について, $i$ 回目の試行が成功した場合 $X_i=1$, 失敗した場合 $X_i = 0$ と定める。

例えば, $X=n$ であった場合, 全ての $i$ で $X_i=1$ であるから $X_1 + \cdots +X_n = n$ となり $X=n$ と一致する。また, $X=2$ である場合, $X_1$ から $X_n$ のうち2個は, 成功したときに対応するもので, その値は $1$ である。他のものの値は $0$ となるため, $X_1 + \cdots + X_n = 2$ で $X=2$ に一致する。

任意の添え字 $i$ について $E[X_i] = p$ である。

確率変数 $X_i$ はベルヌーイ分布 $B(1,p)$ に従うとき, $E[X_i] = p$ である。

$$\begin{aligned}
E[X] &= E [X_1 + \ldots + X_n ] \\
&= E[X_1]+ \ldots + E[X_n] \\
&= p + \cdots + p \\
&= np.
\end{aligned}$$

独立な確率変数 $X$ と $Y$ について $E[X+Y] = E[X] + E[Y]$ である。

ゆえに, $E[X] = np$ である。

二項分布の分散 $V[X]=np(1-p)$

二項分布の分散・標準偏差

$X \sim B(n,p)$ ならば $V[X] = np(1-p)$ であり, $\sigma[X] = \sqrt{np(1-p)}$ である。

二項分布 $B(n,p)$ に従う確率変数 $X$ の分散が $V[X] = np(1-p)$, 標準偏差が $\sigma[X] = \sqrt{np(1-p)}$ であることを証明してみよう。

例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行った結果の確率分布です。分散 $V[X] = 2.1$, 標準偏差は $\sigma[X] = \sqrt{2.1}$ です。

公式のイメージ

1回試行した結果の分散は $0.21$ です。$10$ 回試行した結果の分散は $$
V[X] = 0.21 \times 10 = 2.1$$ です!

公式. 二項分布 $B(n,p)$ に従う確率変数 $X$ について, $V[X]=np(1-p)$, $\sigma[X]=\sqrt{np(1-p)}$ である 。

二項分布 $B(n,p)$ に従う確率変数 $X$ は, ベルヌーイ分布 $B(1,p)$ に従う $n$ 個の独立な確率変数 $X_1$, $\ldots$, $X_n$ の和で表すことができる。

$$X = X_1 + \cdots + X_n$$

$1 \leqq i \leqq n$ について, $i$ 回目の試行が成功した場合 $X_i=1$, 失敗した場合 $X_i = 0$ と定める。

例えば, $X=n$ であった場合, 全ての $i$ で $X_i=1$ であるから $X_1 + \cdots +X_n = n$ となり $X=n$ と一致する。また, $X=2$ である場合, $X_1$ から $X_n$ のうち2個は, 成功したときに対応するもので, その値は $1$ である。他のものの値は $0$ となるため, $X_1 + \cdots + X_n = 2$ で $X=2$ に一致する。

任意の添え字 $i$ について, $X_i$ はベルヌーイ分布 $B(1,p)$ に従う確率変数なので $V[X_i] = p(1-p)$ である。

$$\begin{aligned}
V[X] &= V [X_1 + \ldots + X_n ] \\
&= V[X_1]+ \ldots + V[X_n] \\
&= p(1-p) + \cdots + p(1-p) \\
&= np(1-p).
\end{aligned}$$

独立な確率変数 $X$ と $Y$ について $V[X+Y] = V[X] + V[Y]$ である。

ゆえに, $V[X] = np(1-p)$ である。

また, 標準偏差について $\sigma[X] = \sqrt{np(1-p)}$ である。

Pythonコード

二項分布を表示するコードを紹介します。

二項分布 $B(n, p)$ の試行回数 $n$ と成功確率 $p$ を変えて、分布の形の違いを観察しました。

二項分布のコード【Python】

二項分布のPythonコード

次のコードを入力すれば、二項分布を表示できます。

「二項分布の情報」の $n$ と $p$ の数値を変えて、任意の二項分布が作成できます。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
from scipy.stats import norm

# 二項分布の情報
n = 100  # Number of trials
p = 0.3  # Probability of success

# 二項分布を表示
x_values = np.arange(0, n + 1)
binomial_probs = binom.pmf(x_values, n, p)
plt.bar(x_values, binomial_probs, color='y', alpha=0.7, label = "Binomial-distribution")

# Other Informations
plt.legend() #凡例表示
plt.xlabel("Number of Successes")
plt.ylabel("Probability")
plt.title(f"Binomial Distribution (n={n}, p={p})")
plt.grid(True)
plt.show()

二項分布の表示結果

【観察】二項分布の試行回数の変更

観察開始(Pythonコード)

試行回数 $n$ を変えて、二項分布 $B(n, 0.3)$ の形状を観察しました。

試行結果

試行回数 $n$ が 1から5までの間の二項分布を並べて観察しましょう。

試行回数が少ないときの二項分布

最後に、試行回数が $n=100$ のとき(再掲)と、$n=1000$ のときの二項分布の形状を掲載します。

$n=100$ の二項分布

$n=1000$ の二項分布

二項分布って、こんなものです!

コメントを残す