二項分布について

目次
理解
コード
まとめ

【理解】二項分布とは
- ベルヌーイ分布・二項分布について
- 二項分布の事例について
【コード】Pythonで二項分布を表示
二項分布のコード【Python】
- 二項分布のPythonコード
- 二項分布の表示結果
【観察】二項分布の試行回数の変更
- 観察開始（Pythonコード）
- 試行結果
まとめノート

【理解】二項分布とは

ベルヌーイ分布・二項分布について

ベルヌーイ分布 $B(1,p)$

試行したときに成功する確率を $p$ とします。すると, 失敗する確率は $q=1-p$ となります。

<定義>ベルヌーイ分布

$B(1,p)$

解説はこちら

定義（ベルヌーイ分布）

成功確率が $p$ $(0 \leq p \leq 1)$ である試行を1回行い, 成功の場合に「1」, 失敗の場合に「0」という値をとる確率変数が従う分布をベルヌーイ分布という。

結果	$0$	$1$	計
確率	$1-p$	$p$	$1$

確率分布

確率変数 $X$ がベルヌーイ分布に従うとき, その確率関数 $P(X=x)$ は $$ \begin{aligned} P(X=0) &= 1-p, \\ P(X=1) &= p \end{aligned} $$ である。

表が出たら「1」, 裏が出たら「0」とするコイントスはベルヌーイ試行です。公正なコインの場合 $B(1, 0.5)$ です。表が出る確率が $0.2$ の偏ったコインでは $B(1, 0.2)$ です。

<ベルヌーイ分布>期待値

$E[X]=p$

証明はこちら

ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の期待値が $E[X] = p$ であることを証明してみよう。

ベルヌーイ分布の期待値

ベルヌーイ分布 $B(1, p)$ に従う確率変数 $X$ について, その期待値 $E[X]$ は $$E[X] = p$$ である。ここで, $p$ は事象が起こる確率（成功確率）であり, $0 \leq p \leq 1$ である。

ベルヌーイ分布 $B(1, p)$ に従う確率変数 $X$ の確率分布は次の通りである。

$X$	$0$	$1$	計
確率	$1-p$	$p$	$1$

確率分布 $S$

Step 1期待値の定義への代入

離散確率変数の期待値の定義 $E[X] = \sum_{i=1}^n x_i p_i$ に基づき計算を行う。 $$ \begin{aligned} E[X] &= 1 \cdot p + 0 \cdot (1 - p) \\ &= p \end{aligned} $$

§結論

ゆえに, $E[X] = p$ である。

例えば, 成功確率が $0.3$ のベルヌーイ分布 $B(1,0.3)$ では,

$Y$	$1$	$0$	計
確率	$0.3$	$0.7$	$1$

期待値 $E[X]$ $= 1 \cdot 0.3$ $+ 0 \cdot 0.7$ $= 0.3$ です。

<ベルヌーイ分布>分散

分散 $V[X]=p(1-p)$

証明はこちら

ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の分散が $V[X] = p(1-p)$ であることを証明してみよう。

ベルヌーイ分布の分散

ベルヌーイ分布 $B(1, p)$ に従う確率変数 $X$ について, その分散 $V[X]$ は $$V[X] = p(1-p)$$ である。ただし, $p$ は成功確率（$0 \leq p \leq 1$）である。

ベルヌーイ分布 $B(1, p)$ に従う確率変数 $X$ の確率分布は次の通りである。

$X$	$0$	$1$	計
確率	$1-p$	$p$	$1$

確率分布

§分散の定義への代入

ベルヌーイ分布の期待値は $E[X] = p$ である。分散の定義 $V[X] = \sum (x_i - E[X])^2 p_i$ に基づき計算を行う。 $$ \begin{aligned} V[X] &= (1 - p)^2 \cdot p + (0 - p)^2 \cdot (1 - p) \\ &= p - p^2 \\ &= p(1 - p) \end{aligned} $$

§結論

ゆえに, $V[X] = p(1 - p)$ である。

例えば, 成功確率が $p=0.3$ のベルヌーイ分布 $B(1,0.3)$

$Y$	$1$	$0$	計
確率	$0.3$	$0.7$	$1$

について, 分散は $V[X]$ $=1 \cdot 0.3$ $+ 0 \cdot 0.7$ $= 0.3$ です。

<ベルヌーイ分布>標準偏差

$\sigma[X]=\sqrt{p(1-p})$

証明はこちら

ベルヌーイ分布 $B(1,p)$ に従う確率変数 $X$ の標準偏差 $\sigma[X] = \sqrt{p(1-p)}$ であることを証明してみよう。

ベルヌーイ分布の標準偏差

ベルヌーイ分布 $B(1, p)$ に従う確率変数 $X$ について, 標準偏差 $\sigma[X]$ は $$\sigma[X] = \sqrt{p(1-p)}$$ である。ただし, $p$ は成功確率（$0 \leq p \leq 1$）である。

標準偏差の定義に従い, ベルヌーイ分布 $B(1, p)$ の分散から算出する。

§分散の確認

ベルヌーイ分布の分散は, 次の通りである。 $$ V[X] = p(1-p) $$

§結論

標準偏差の定義は $\sigma[X] = \sqrt{V[X]}$ である。ゆえに, $\sigma[X] = \sqrt{p(1-p)}$ である。

例えば, 成功確率が $p=0.3$ のベルヌーイ分布 $B(1,0.3)$

$Y$	$1$	$0$	計
確率	$0.3$	$0.7$	$1$

について, $V[X] = 0.21$ なので, $\sigma[X] = \sqrt{0.21} \fallingdotseq 0.46 $ です。

二項分布 $B(n,p)$

１回だけ試行したときに成功する確率を $p$ とします。すると, 失敗する確率は $q=1-p$ となります。

<定義>二項分布 $B(n,p)$

$$P(X=r) = {}_n \mathrm{C}_rp^r(1-p)^{n-r}$$

解説はこちら

定義（二項分布）

成功確率が $p$ $(0 \leq p \leq 1)$ である独立な試行を $n$ 回繰り返したとき, 成功した回数を表す確率変数が従う確率分布を二項分布 $B(n, p)$ という。

このとき, 成功回数が $k$ 回（$k = 0, 1, \dots, n$）となる確率は, $$P(X = k) = {}_n\mathrm{C}_k \, p^k (1-p)^{n-k}$$ で与えられる。

10回コイントスをしたときの表の回数は二項分布 $\displaystyle B\left(10, \frac{1}{2} \right)$ です。また, サイコロを5回転がしたときの5以上の目が出る回数は $\displaystyle B \left(5, \frac{1}{3} \right)$ です。

<命題>反復試行と二項分布

$\begin{aligned}
&X_1, \ldots , X_n \sim B(1,p) \\
& \Rightarrow X_1 + \ldots +X_n \sim B(n,p)
\end{aligned}$

証明はこちら

命題（二項分布とベルヌーイ試行の関係）

$X_1, \dots, X_n$ を, ベルヌーイ分布 $B(1, p)$ に従う互いに独立な確率変数とする。

確率変数の和 $X_1 + \dots + X_n$ は, 二項分布 $B(n, p)$ に従う。

二項分布 $B(n, p)$ に従う確率変数 $X$ は, $n$ 個の独立なベルヌーイ分布に従う確率変数の和 $$X = X_1 + \dots + X_n$$ として表すことができる。

成功確率 $p$ のベルヌーイ分布 $B(1, p)$ に従う $n$ 個の独立な確率変数 $X_1, \dots, X_n$ を考える。

$X_r$	$0$	$1$	計
確率	$1-p$	$p$	$1$

Part 1確率変数の和が二項分布に従うこと

和 $X_1 + \dots + X_n = r$ ($0 \le r \le n$) となる場合は, $n$ 個の確率変数のうち, いずれか $r$ 個が $1$ を取り, 残りの $n-r$ 個が $0$ を取ることを意味する。各確率変数は独立であるため, 特定の組み合わせ（例えば $X_1 = \dots = X_r = 1$ かつ $X_{r+1} = \dots = X_n = 0$）が起こる確率は $p^r (1-p)^{n-r}$ である。このような組み合わせの数は, ${}_n \mathrm{C}_r$ 通り存在する。したがって, その確率は次のように表される。 $$ P(X_1 + \dots + X_n = r) = {}_n \mathrm{C}_r p^r (1-p)^{n-r} $$ これは二項分布 $B(n, p)$ の定義そのものである。

Part 2二項分布の分解

逆に, 二項分布 $B(n, p)$ に従う確率変数 $X$ について考える。 $n$ 回の試行のうち, $i$ 回目の試行の結果を表す確率変数を $X_i$ とし, 成功時に $X_i=1$, 失敗時に $X_i=0$ と定めると, 各 $X_i$ は独立なベルヌーイ分布 $B(1, p)$ に従う。二項分布は「独立な試行を繰り返した時の成功回数」を表すため, 各試行の結果を足し合わせることで次のように表せる。 $$ X = X_1 + \dots + X_n $$ これらの和は前述の通り, $B(n,p)$ に従う確率変数となる..

§結論

ゆえに, $B(n, p)$ に従う確率変数 $X$ は, $n$ 個の独立なベルヌーイ分布に従う確率変数の和として表すことができる。

例えば, $n=2$ のとき

$X_1, X_2$	$0$	$1$	計
$0$	$(1-p)^2$	$(1-p)p$	$1-p$
$1$	$p(1-p)$	$p^2$	$p$
計	$1-p$	$p$	$1$

$X_1 + X_2=2$ のときは, $(X_1, X_2)$ $=(1,1)$ のときのみであり確率は $p^2$ である。

$X_1 + X_2=1$ のときは, $(X_1, X_2)$ $=(1,0)$, $(0,1)$ であるから確率は $2p(1-p)$ である。

$X_1 + X_2=0$ のときは, $(X_1, X_2)$ $=(0,0)$ のときのみであり確率は $(1-p)^2$ である。

したがって, $X_1 + X_2$ は二項分布 $B(2,p)$ に従っています。

<二項分布>期待値

$E[X]=np$

証明はこちら

二項分布 $B(n,p)$ に従う確率変数 $X$ の期待値が $E[X] = np$ であることを証明してみよう。

公式（二項分布の期待値）

二項分布 $B(n, p)$ に従う確率変数 $X$ について, その期待値 $E[X]$ は $$E[X] = np$$ である。ただし, $n$ は試行回数, $p$ は各試行における成功確率（$0 \leq p \leq 1$）である。

二項分布 $B(n, p)$ に従う確率変数 $X$ は, 成功確率 $p$ のベルヌーイ分布 $B(1, p)$ に従う $n$ 個の独立な確率変数 $X_1, \dots, X_n$ の和として表すことができる。 $$ X = X_1 + \dots + X_n $$ ここで, 各 $X_i$ は $i$ 回目の試行が成功したとき $1$, 失敗したとき $0$ をとる変数である。

Step 1期待値の線形性の適用

期待値の性質より, 確率変数の和の期待値は, それぞれの期待値の和に等しい。 $$\begin{aligned} E[X] &= E[X_1 + \dots + X_n] \\ &= E[X_1] + \dots + E[X_n] \end{aligned}$$ 各 $X_i$ はベルヌーイ分布 $B(1, p)$ に従うため, すべての $i$ についてその期待値は $E[X_i] = p$ である。

Step 2計算の完結

したがって, $E[X]$ は次のように計算される。 $$ \begin{aligned} E[X] &= \underbrace{p + p + \dots + p}_{n \text{個}} \\ &= np \end{aligned} $$

§結論

ゆえに, $E[X] = np$ である。

例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行う確率分布です。

1回試行した結果の期待値は $0.3$ で, $10$ 回試行した結果の期待値は $E[X]$ $= 0.3 \times 10$ $= 3$ です。

<二項分布>分散

$V[X]=np(1-p)$

証明はこちら

二項分布 $B(n,p)$ に従う確率変数 $X$ の分散が $V[X] = np(1-p)$ であることを証明してみよう。

公式（二項分布の分散）

二項分布 $B(n, p)$ に従う確率変数 $X$ について, その分散 $V[X]$ は $$V[X] = np(1 - p)$$ である。ただし, $n$ は試行回数, $p$ は各試行における成功確率（$0 \leq p \leq 1$）である。

二項分布 $B(n, p)$ に従う確率変数 $X$ は, 成功確率 $p$ のベルヌーイ分布 $B(1, p)$ に従う $n$ 個の独立な確率変数 $X_1, \dots, X_n$ の和として表すことができる。 $$ X = X_1 + \dots + X_n $$

Step 1分散の加法性の適用

$X_1, \dots, X_n$ は互いに独立であるから, 分散の性質より, 次の等式が成り立つ。 $$\begin{aligned} V[X] &= V[X_1 + \dots + X_n] \\ &= V[X_1] + \dots + V[X_n] \end{aligned} $$ 各 $X_i$ はベルヌーイ分布 $B(1, p)$ に従うため, すべての $i$ についてその分散は $V[X_i] = p(1 - p)$ である。

Step 2計算の完結

したがって, $V[X]$ は次のように計算される。 $$ \begin{aligned} V[X] &= \underbrace{p(1 - p) + \dots + p(1 - p)}_{n \text{個}} \\ &= np(1 - p) \end{aligned} $$

§結論

ゆえに, $V[X] = np(1 - p)$ である。

例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行った結果の確率分布です。

1回試行した結果の分散は $0.21$ です。$10$ 回試行した結果の分散は $V[X]$ $= 0.21 \times 10$ $= 2.1$ です。

<ベルヌーイ分布>標準偏差

$\sigma[X]=\sqrt{np(1-p})$

証明はこちら

二項分布 $B(n,p)$ に従う確率変数 $X$ の標準偏差が $\sigma[X] = \sqrt{np(1-p)}$ であることを証明してみよう。

公式（二項分布の標準偏差）

二項分布 $B(n, p)$ に従う確率変数 $X$ について, その標準偏差 $\sigma[X]$ は $$\sigma[X] = \sqrt{np(1 - p)}$$ である。ただし, $n$ は試行回数, $p$ は各試行における成功確率（$0 \leq p \leq 1$）である。

二項分布 $B(n, p)$ に従う確率変数 $X$ の分散 $V[X]$ から, 標準偏差 $\sigma[X]$ を導出する。

Step 1分散と標準偏差の関係

二項分布の分散は, 次の通りである。 $$ V[X] = np(1 - p) $$ 標準偏差の定義は, 分散の正の平方根 $\sigma[X] = \sqrt{V[X]}$ である。

§結論

ゆえに, $\sigma[X] = \sqrt{np(1 - p)}$ である。

例えば, 二項分布 $B(10,0.3)$ は, 成功確率が $0.3$ の試行を $10$ 回行った結果の確率分布です。

分散は $V[X] = 2.1$ です。標準偏差は $\sigma[X] = \sqrt{2.1}$ です。

二項分布の事例について

<事例>メレ氏の賭博

$B(24, 1/36)$

解説はこちら

2個のサイコロを24回振るとき, 6のゾロ目が少なくとも1回出るかどうかに賭けるか否かという問題。

シュパリエ・ド・メレ氏はこの賭博に失敗した。

<事例>ゴルトンボード

二項分布・正規分布

詳細はこちら

【コード】Pythonで二項分布を表示

二項分布のヒストグラムの表示

二項分布 $B(n,p)$ のヒストグラムをPythonで出力してみよう。

二項分布の出力

試行回数nと成功確率pによって二項分布 $B(n,p)$ を定める.

scipy.statsのbinom.pmf()によって, 二項分布のそれぞれの確率を計算する.

matplotlib.pyplotで棒グラフ.barを描くことでヒストグラムを作成する.

Pythonコード.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom

# 二項分布の情報
n = 100  # 試行回数
p = 0.3  # 成功確率

# 二項分布を表示
x_values = np.arange(0, n + 1)
binomial_probs = binom.pmf(x_values, n, p)
plt.bar(x_values, binomial_probs, color='y', alpha=0.7, label = "Binomial-distribution")

# グラフの表示
plt.legend() #凡例表示
plt.xlabel("Number of Successes")
plt.ylabel("Probability")
plt.title(f"Binomial Distribution (n={n}, p={p})")
plt.grid(True)
plt.show()

二項分布のグラフの形状の比較

二項分布を表示するコードを紹介します。

二項分布 $B(n, p)$ の試行回数 $n$ と成功確率 $p$ を変えて、分布の形の違いを観察しました。

二項分布のコード【Python】
- 二項分布のPythonコード
- 二項分布の表示結果
【観察】二項分布の試行回数の変更
- 観察開始（Pythonコード）
- 試行結果

二項分布のコード【Python】

二項分布のPythonコード

次のコードを入力すれば、二項分布を表示できます。

「二項分布の情報」の $n$ と $p$ の数値を変えて、任意の二項分布が作成できます。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
from scipy.stats import norm

# 二項分布の情報
n = 100  # Number of trials
p = 0.3  # Probability of success

# 二項分布を表示
x_values = np.arange(0, n + 1)
binomial_probs = binom.pmf(x_values, n, p)
plt.bar(x_values, binomial_probs, color='y', alpha=0.7, label = "Binomial-distribution")

# Other Informations
plt.legend() #凡例表示
plt.xlabel("Number of Successes")
plt.ylabel("Probability")
plt.title(f"Binomial Distribution (n={n}, p={p})")
plt.grid(True)
plt.show()

二項分布の表示結果

【観察】二項分布の試行回数の変更

観察開始（Pythonコード）

試行回数 $n$ を変えて、二項分布 $B(n, 0.3)$ の形状を観察しました。

試行結果

試行回数 $n$ が 1から5までの間の二項分布を並べて観察しましょう。

試行回数が少ないときの二項分布

最後に、試行回数が $n=100$ のとき（再掲）と、$n=1000$ のときの二項分布の形状を掲載します。

$n=100$ の二項分布

$n=1000$ の二項分布

二項分布って、こんなものです！

まとめノート

「二項分布」とは

硬貨を何枚か同時に投げて表が出る回数を表す確率分布のこと。

記号

試行回数 $n$, 確率 $p$ の二項分布を

$B(n, p)$

と書く.

A. 二項分布の確率分布

確率 $p$ の事象が $k$ 回起こる確率は次の通り：$$P(X=k) = {}_n \mathrm{C}_k \cdot p^k \cdot (1-p)^{n-k}$$

B. ベルヌーイ分布

$0$ か $1$ が起こることをベルヌーイ試行という. ベルヌーイ分布は $B(1,p)$ であり, 確率変数を $Y$ とすれば, 期待値 $E[Y] = p$, 分散 $V[Y]=p(1-p)$ である.

C. 期待値と分散

①$E(X) = np$

②$V(X) =np(1-p)$

D. 二項分布の正規分布近似

二項分布 $B(n,p)$ は $n$ が大きいとき, 正規分布 $N(np, np(1-p))$ に近似できる.

ポイント解説

確率分布は $0 \sim n$ の範囲で,

$np$ 周辺でピークの山型のヒストグラム

になる.

ベルヌーイ試行の確率分布：

$Y$	$1$	$0$	計
$P(Y)$	$p$	$1-p$	$1$

ベルヌーイ分布に従う確率変数の和 $X=Y_1 + \cdots + Y_n$ は $B(n,p)$ に従う.

$P(X=k)$ の確率分布から直接証明する, もしくはベルヌーイ試行の繰り返しで証明する.

Excel

4つの引数を入力；

BINOM.DIST(成功回数 $k$, 試行回数 $n$, 成功確率 $p$, 関数形式)

※関数形式；TRUE→下側累積確率, FALSE→ $P(X=k)$ の値を出力する.

カテゴリー: 絵馬

タグ: 情報科統計的な推測

【理解】二項分布とは

ベルヌーイ分布・二項分布について

ベルヌーイ分布 $B(1,p)$

二項分布 $B(n,p)$

二項分布の事例について

【コード】Pythonで二項分布を表示

二項分布のコード【Python】

二項分布のPythonコード

二項分布の表示結果

【観察】二項分布の試行回数の変更

観察開始（Pythonコード）

試行結果

試行回数が少ないときの二項分布

$n=100$ の二項分布

$n=1000$ の二項分布

まとめノート

コメントを残すコメントをキャンセル

同時確率分布と独立性について

【Python】二項分布が正規分布に近似できるか検証してみた

二項分布について

【理解】二項分布とは

ベルヌーイ分布・二項分布について

ベルヌーイ分布 $B(1,p)$

二項分布 $B(n,p)$

二項分布の事例について

【コード】Pythonで二項分布を表示

二項分布のコード【Python】

二項分布のPythonコード

二項分布の表示結果

【観察】二項分布の試行回数の変更

観察開始（Pythonコード）

試行結果

試行回数が少ないときの二項分布

$n=100$ の二項分布

$n=1000$ の二項分布

まとめノート

コメントを残す コメントをキャンセル

同時確率分布と独立性について

【Python】二項分布が正規分布に近似できるか検証してみた

コメントを残すコメントをキャンセル