二项实验需满足下列性质:
最常用二项实验为抛硬币实验。假设我们抛10次,这十次实验有下列属性:
如果随机变量服从二项分布,那么概率x=k(成功的次数)公式如下:
P(X=k) = n C k ∗ p k ∗ ( 1 − p ) n − k {_nC_k * p^k * (1-p)^{n-k}} nCk∗pk∗(1−p)n−k
参数说明:
n: 实验次数
k: 成功次数
p: 实验成功的概率
n C k {_nC_k} nCk: n次实验获得k次成功
可以使用numpy包中random.binomial函数生成服从二项分布的数组:
from numpy import random
# 生成10个值服从正太分布
random.binomial(n=10, p=.25, size=10)
# array([5, 2, 1, 3, 3, 3, 2, 2, 1, 4])
数组中的每个元素表示:给定成功概率为.25,进行10次实验成功的次数。
可以使用scipy库中的binom函数回答下列几个问题。
from scipy.stats import binom
# 计算二项分布概率
binom.pmf(k=10, n=12, p=0.6)
# 0.0639
正好有10次成功的概率为0.0639
from scipy.stats import binom
# 计算累积概率
binom.cdf(k=2, n=5, p=0.5)
# 0.5
# 计算二项分布概率
binom.pmf(k=2, n=5, p=0.5)
# 0.3125
硬币落地为正面2次或更少的概率为.5
from scipy.stats import binom
# 计算累积概率
binom.cdf(k=6, n=10, p=0.7) - binom.cdf(k=3, n=10, p=0.7)
# 0.3398
结果为有4~6人支持的概率为0.3398
我们可以通过seaborn、matplotlib库可视化二项分布:
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.binomial(n=10, p=0.5, size=1000)
sns.distplot(x, hist=True, kde=False)
plt.show()
x 轴表示10次实验成功的次数,y轴表示1000次实验中成功数值发送的次数。
