帕斯卡分布,负二项分布的正整数形式。当变量 x x x表示某项实验获得 k k k次成功时,实验重复的次数,变量 x x x服从帕斯卡分布,实验成功概率为: p p p。
P ( x ) = C k − 1 x − 1 p k ( 1 − p ) x − k , x = k , k + 1 , . . . P(x) = C_{k-1}^{x - 1} p^k(1 - p)^{x - k},x = k, k+1, ... P(x)=Ck−1x−1pk(1−p)x−k,x=k,k+1,...
F ( x ) = ∑ y = k x P ( y ) , x = k , k + 1 , . . . F(x) = \sum_{y=k}^x P(y),x = k, k+1, ... F(x)=y=k∑xP(y),x=k,k+1,...
期望和方差:
E ( x ) = k p E(x) = \frac{k}{p} E(x)=pk
V ( x ) = k ( 1 − p ) p 2 V(x) = \frac{k(1 - p)}{p^2} V(x)=p2k(1−p)
当变量 x ′ x' x′定义为获得 k k k次成功时,失败的次数, x ′ = x − k x' = x - k x′=x−k:
生成Pascal变量: x x x
例:变量 x x x为帕斯卡变量, p = 0.5 , k = 5 p = 0.5,k = 5 p=0.5,k=5, x x x表示为获得第5次成功时,实验重复的次数,生成变量 x x x。
import numpy as np
import matplotlib.pyplot as plt
def generate_pascal(k=5, p=0.1):
x = np.sum(np.random.geometric(p=p, size=(k)))
return x