假设N个产品中M个废品,以X记为从N个产品中随机抽出n个里面所包含的废品数m,则:
P
(
X
=
m
)
=
(
m
M
)
(
n
−
m
N
−
M
)
/
(
n
N
)
P(X=m) = {\Large (^M_m)(^{N-M}_{n-m})/(^N_n)}
P(X=m)=(mM)(n−mN−M)/(nN)
其中:0≤m≤M,n≤N,n-m≤N-M。
上述概率函数就是超几何分布的概率函数,之所以称为这个名字,是因为其形式与“超几何函数”的级数展开式有关。
这个分布在涉及抽样的问题中常用,特别当 N不大时。因为通常在抽样时,多是“无放回的”,即已抽出的个体不再有放回去以供再次抽出的机会,这就与把n个同时抽出的效果一样,如果一个一个地抽而抽出过的仍放回,则结果是二项分布。
对于二项分布,如果n/N很小,则放回与不放回差别不大。由此可见,在这种情况下超几何分布应与二项分布很接近,确切地说,若X服从超几何分布,则当n 固定时,M/N=p固定;N→∞时,X近似地服从二项分布B(n,p)。
为了检查某厂产品的废品率 p 大小,有两个试验方案可采取:一是从该厂产品中抽出若干个,检查其中的废品数X,这一方案导致二项分布;
另一个方案是先指定一个自然数r,一个一个地从该厂产品中抽样检查,直到发现第r个废品为止。以X记到当时为止已检出的合格品个数。显然,若废率p小,则X倾向于取较大的值;反之当p大时,则X倾向于取小值。故X可用于衡量p的大小。为计算X的分布,假定各次抽取的结果(是否为废品)是独立的,且每次抽得废品的概率保持固定为p。
考察{X=i}这个事件,为使这个事件发生,需要以下两个事件同时发生:
按所作假定,这两个事件的概率分别为b(r-1;i+r-1,p)和p。再由独立性,即得:
P
(
X
=
i
)
=
b
(
r
−
1
;
i
+
r
−
1
,
p
)
p
=
(
r
−
1
i
+
r
−
1
)
p
r
(
1
−
p
)
i
{\Large P(X=i) = b(r-1;i+r-1,p)p \,\, = \,(^{i+r-1}_{r-1})p^r(1-p)^i}
P(X=i)=b(r−1;i+r−1,p)p=(r−1i+r−1)pr(1−p)i
这个分布称为负二项分布。
老猿注:上面的推导中,用到了负数的组合数和负数的阶乘,相关定义与正数一样,因此有:
(
i
−
r
)
=
(
−
r
)
!
i
!
(
−
r
−
i
)
!
=
(
−
r
)
(
−
r
−
1
)
.
.
.
(
−
r
−
i
+
1
)
i
!
{(^{-r}_{\;\;i})=\frac{(-r)!}{i!(-r-i)!}=\frac{(-r)(-r-1)...(-r-i+1)}{i!}}
(i−r)=i!(−r−i)!(−r)!=i!(−r)(−r−1)...(−r−i+1)
=
(
−
1
)
i
r
(
r
+
1
)
.
.
.
(
r
+
i
−
1
)
i
!
=(-1)^i\;\;\frac{r(r+1)...(r+i-1)}{i!}
=(−1)ii!r(r+1)...(r+i−1)
=
(
−
1
)
i
(
r
+
i
−
1
)
!
(
r
−
1
)
!
i
!
=
(
−
1
)
i
(
i
r
+
i
−
1
)
=(-1)^i\;\;\frac{(r+i-1)!}{(r-1)!i!}=(-1)^i\;\;(^{r+i-1}_{\;\;i})
=(−1)i(r−1)!i!(r+i−1)!=(−1)i(ir+i−1)
当取负二项分布中的r=1,则负二项分布变为了:
P
(
X
=
i
)
=
(
0
i
)
p
(
1
−
p
)
i
=
p
(
1
−
p
)
i
{\Large P(X=i) =\,(^{i}_{0})p(1-p)^i=p(1-p)^i}
P(X=i)=(0i)p(1−p)i=p(1−p)i
这是一个公比为(1-p)的等比级数,也称为几何级数,这种情况下的分布称为几何分布。
本文介绍了离散随机变量的超几何分布、负二项分布、几何分布的概念,以及相关的公式推导,从介绍可知,他们与二项分布有密切的关系。
更多人工智能数学基础请参考专栏《人工智能数学基础》。
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。
对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。
如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。