• 概率论的学习和整理10:0-1分支 和 二项分布


    1 伯努利试验

    1.1 什么是伯努利试验

    伯努利试验

    • 伯努利试验是一个有两种结果的简单试验,它的结果是成功或失败,黑或白,开或关,没有中间的立场。
    • 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种

    伯努利概型是一种基于独立重复试验的概率模型,它的基本特征:

    • 在一组固定不变的条件下重复地做一种试验。
    • 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种
    • 每次试验中,相同事件发生的概率均一样。(试验样本总数和概率不能变)
    • 各次重复试验的结果是相互独立,互不影响的。
    • 1重伯努利试验 就是 0-1分布
    • n 重伯努利试验 就是二项分布     p=C(n,k)*p^k*(1-p)^n-k

    N重伯努利试验 和二项分布
     优势

    • 不要求具体的样本总量的具体 数量
    • 只需要知道概率就行,但要求概率是稳定不变的(多次伯努利试验时)
    • 还需要知道 抽样试验的次数,目标事件的次数

     局限性

    • 能不能用二项分布先判断,是不是符合N重伯努利试验,如果不符合就没戏
    • 二项分布,伯努利试验,需要保证样本容量确定,且分布也要稳定,否则不能
    • 必须是放回抽样
    • 如果是不放回抽样,
    1. 要么认为样本极其大,忽略样本总量变化,概率变化不稳定的影响
    2. 要么得用超几何分布

    使用时注意点

    • 需要严格认识的地方:
    • N次试验,每次试验都稳定,样本总数和概率都稳定才能视为N重伯努利试验,才能用二项分布
    • 不放回抽样,一般不适合二项分布
    • 因为小样本量前提下,不放回抽样会破坏第一次试验后的样本空间数和概率,发生变化!第2次试验无法和第1次相同了
    • 如果样本量足够大,即使是不放会抽样,可以用二项分布近似

    1.2 伯努利试验相关的3种分布

    • 0-1分布
    • 只进行1次伯努利试验的随机变量,符合0-1分布,f(x=k)=p^k*(1-p)^(1-k)
    • k={0,1}

    • 几何分布:
    • 进行n次伯努利试验,只有最后1次成功,成功次数第N次,N符合几何分布
    • f(x=k)=p*(1-p)^(k-1)
    • 其中 k 是总试验次数,一共进行了k次,且第k次(也就是最后1次)成功

    • 二项分布:
    • 进行N次伯努利试验,有k次成功,成功次数k符合二项分布
    • f(x=k)=C(n,k)*p^k*(1-p)^(n-k)
    • 其中n是总试验次数,k是成功次数(对应成功的概率p)

    2 关于0-1分布 (也称为伯努利分布  \ ab分布 \ 两点分布等)

    2.1 0-1分布的基本概率和公式

    0-1分布:只进行1次伯努利试验的随机变量,结果只有2种,符合0-1分布

     一个随机事件,发生记为k=1,不发生记为k=0,若事件服从0-1分布,

    则k的分布律为:      
                   k      0       1                 
                p(k)    1-p    p          

    • 0-1分布的概率公式 f(x)=p^k*(1-p)^(1-k)
    • k={0,1}
    • 其实就是
    1. k=1时,f(x)=p 
    2. k=0时,f(x)=1-p

    2.2 0-1分布的概率分布图,pdf 和 cdf

    • 0-1分布,因为只有1次试验
    • 只有两种结果
    • 所以分布图看起来就是这种直线。。。。
     kp1p2p3p4p5
    pdf00.90.80.50.20.1
     10.10.20.50.80.9
    cdf00.90.80.50.20.1
     111111

    2.3 0-1分布的期望和方差                 

    • E(X)    = 0*(1-p)+1*p  =    p                
    • D(X)    =    p*(1-P)         
    • 缺少证明过程       

                                        
                

    3  几何分布

    3.1 什么是几何分布

    几何分布就是一种定义为:在n次伯努利试验中,试验k次才得到第一次成功的机率。

    详细地说是:前k-1次皆失败,第k次成功的概率。

    • 首先几何分布,属于古典概型/ 伯努利试验
    • 特点是:只有每次试验只可能有两种结果
    • 如果只做1次试验,那是属于0-1分布,但是如果做N次试验,但是只有最后一次成功,则随机变量符合 几何分布,但是如果做N次试验,没其他限制,则随机变量符合 二项分布
    • 由上可知,0-1分布,几何分布,应该都可以归纳为,二项分布的一种特例。

    4 二项分布

    4.1 什么是二项分布 和N重伯努利试验

    • 在概率论和统计学中,二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布,
    • 其中每次试验的成功概率为p。
    • 其实,只有符合N重伯努利试验的随机变量,才可能服从二项分布!

    • 二项分布包含0-1分布和几何分布
    • 当n=1时,二项分布就是伯努利分布,也就是0-1分布,如果只有最后一次成功又是几何分布。

    4.2 二项分布的公式

    • 一般地,如果随机变量服从参数为和的二项分布,我们记为或。n次试验中正好得到k次成功的概率由概率质量函数给出: 
    • p(x=k)=C(n,k)*p^k*(1-p)^(n-k)
    • 其中n是总试验次数,k是成功次数(对应成功的概率p)
    • 式中k=0,1,2,…
    • 而C(n,k)= n!/(n-k)!*k!  是二项式系数,(这就是二项分布名称的由来)

    •  该公式可以用以下方法理解:我们希望有k次成功(p)和n−k次失败(1 −p)。
    • 并且,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有个C(n,k)不同的方法。

    4.3 二项分布的两个概率的概念理解

    • 二项分布,指的是N次试验里成功k次的概率符合二项分布
    • 而内部的单次试验,是伯努利试验,其单次试验的概率p,是稳定不变的。
    • N 次试验里成功k次的概率的  k~~p(k) 情况 
    • p(k) 是 表示多次试验,且要求(n次出k次成功)的概率
    • p(k) 和单次试验的概率P不要混淆
       

    4.4 二项分布概率分布函数

    4.4.1 二项分布的pdf 和cdf 如图

    • 二项分布的pdf
    • 二项分布的cdf

    4.4.2 二项分布的pdf 的变化

    先看下整体图

    • 纵向是,单次伯努利试验的p提升
    • 横向是,试验次数n的增加
    • 内部里面是,坐标系的横轴是 n次试验成功次数k,k的概率变化

    纵向看

    • 在总试验次数不变的前提下,随着 单次伯努利试验里,概率p的增加
    • 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率越大,n次试验内成功k次,k也会越大,符合直觉)
    • 概率很小的时候,可能只成功0次,1次的概率很大,
    • 概率很大的时候,试验n次,k次成功的k越来越大,甚至接近n了

    横向看

    • 在单次伯努利试验里,概率p不变的前提下,随着试验次数的增多
    • 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率不变,n次试验内成功k次,试验次数n越多,k也会越大,符合直觉)
    • 但是概率不变前提下, 虽然成功的次数k变多了,但比例并不变(因为基础的单次伯努利试验的概率没变,这是横向变化的前提)

    4.5 二项分布的期望和方差

    • 二项分布的期望
    • E(X)=n*p
    • 二项分布的方差
    • D(X)=n*p*(1-P)

    缺乏推导过程

    4.6 二项分布的一个例题

    • 如果像利用二项分布,需要灵活的去划分样本空间为2种结果,比如例题中的
    • 这样划分2种:这次抽样后需要调整机器  == 对应的变量是本次检验,次品数量>1
    1. 今天某次检查次品数>1==今天需要调整机器  / 对立今天不调整机器
    2. 每天检查4次,相当于做了4次伯努利试验
    3. 方法1,完全用了二项分布思路和解法
    4. 方法2,用了古典概型的,每次试验都是独立的,和加法原理加起来算的
    • 注意,为了达到目标事件,事件可能需要几次户型转化,随机变量可能要转化几次

     

     

  • 相关阅读:
    Worthington优化技术:细胞定量
    【人工智能基础】人工神经网络
    普通空调实现远程控制基础知识解读
    XXE漏洞以及XXE漏洞如何修复
    小程序 检测是否添加至我的小程序
    直流电机双闭环调速Simulink仿真
    eclipse 新建项目没有web选项解决办法
    NetworkX的基本用法
    对vuex的理解,必须知道的知识点
    使用Python,PCA对iris数据集降维2维/3维并进行2D,3D散点图绘制(包括有图例&无图例,有标题Label&无标题Label)
  • 原文地址:https://blog.csdn.net/xuemanqianshan/article/details/126275966