码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 人工智能数学基础--概率与统计11:离散随机变量的超几何分布和负二项分布


    一、超几何分布

    1.1、定义

    假设N个产品中M个废品,以X记为从N个产品中随机抽出n个里面所包含的废品数m,则:
    P ( X = m ) = ( m M ) ( n − m N − M ) / ( n N ) P(X=m) = {\Large (^M_m)(^{N-M}_{n-m})/(^N_n)} P(X=m)=(mM​)(n−mN−M​)/(nN​)
    其中:0≤m≤M,n≤N,n-m≤N-M。

    上述概率函数就是超几何分布的概率函数,之所以称为这个名字,是因为其形式与“超几何函数”的级数展开式有关。

    1.2、与二项分布关系

    这个分布在涉及抽样的问题中常用,特别当 N不大时。因为通常在抽样时,多是“无放回的”,即已抽出的个体不再有放回去以供再次抽出的机会,这就与把n个同时抽出的效果一样,如果一个一个地抽而抽出过的仍放回,则结果是二项分布。

    对于二项分布,如果n/N很小,则放回与不放回差别不大。由此可见,在这种情况下超几何分布应与二项分布很接近,确切地说,若X服从超几何分布,则当n 固定时,M/N=p固定;N→∞时,X近似地服从二项分布B(n,p)。

    二、负二项分布

    2.1、结合例子的定义

    为了检查某厂产品的废品率 p 大小,有两个试验方案可采取:一是从该厂产品中抽出若干个,检查其中的废品数X,这一方案导致二项分布;

    另一个方案是先指定一个自然数r,一个一个地从该厂产品中抽样检查,直到发现第r个废品为止。以X记到当时为止已检出的合格品个数。显然,若废率p小,则X倾向于取较大的值;反之当p大时,则X倾向于取小值。故X可用于衡量p的大小。为计算X的分布,假定各次抽取的结果(是否为废品)是独立的,且每次抽得废品的概率保持固定为p。
    考察{X=i}这个事件,为使这个事件发生,需要以下两个事件同时发生:

    1. 在前 i+r-1 次抽取中,恰有r-1个废品;
    2. 第 i+r 次抽出废品。

    按所作假定,这两个事件的概率分别为b(r-1;i+r-1,p)和p。再由独立性,即得:
    P ( X = i ) = b ( r − 1 ; i + r − 1 , p ) p    =   ( r − 1 i + r − 1 ) p r ( 1 − p ) i {\Large P(X=i) = b(r-1;i+r-1,p)p \,\, = \,(^{i+r-1}_{r-1})p^r(1-p)^i} P(X=i)=b(r−1;i+r−1,p)p=(r−1i+r−1​)pr(1−p)i

    这个分布称为负二项分布。

    2.2、负二项分布的由来
    1. 负二项分布这个名称的来由缘由在“负指数二项展开式”:
      ( 1 − x ) − r = ∑ 0 ∞ (      i − r ) ( − x ) i = ∑ 0 ∞ (        i i + r − 1 ) x i = ∑ 0 ∞ (      r − 1 i + r − 1 ) x i {\Large (1-x)^{-r}=\sum\limits_0^∞(^{-r}_{\;\;i})(-x)^i=\sum\limits_0^∞(^{i+r-1}_{\;\;\;i})x^i=\sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})x^i} (1−x)−r=0∑∞​(i−r​)(−x)i=0∑∞​(ii+r−1​)xi=0∑∞​(r−1i+r−1​)xi
      令x=1-p,并在上式左右两边等乘以 p r p^r pr,得到:
      1 = ∑ 0 ∞ (      r − 1 i + r − 1 ) ( 1 − p ) i p r 1 = \sum\limits_0^∞(^{i+r-1}_{\;\;{r-1}})(1-p)^ip^r 1=0∑∞​(r−1i+r−1​)(1−p)ipr
      这就证明了负二项分布的所有 P(X=i)的和等于1。
    2. 二项分布在试验抽样时,定下抽样个数n而把废品个数X作为变量,负二项分布则相反,是定下废品个数r,而把总抽样次数减去r作为变量,也基于此称为负二项分布。

    老猿注:上面的推导中,用到了负数的组合数和负数的阶乘,相关定义与正数一样,因此有:
    (      i − r ) = ( − r ) ! i ! ( − r − i ) ! = ( − r ) ( − r − 1 ) . . . ( − r − i + 1 ) i ! {(^{-r}_{\;\;i})=\frac{(-r)!}{i!(-r-i)!}=\frac{(-r)(-r-1)...(-r-i+1)}{i!}} (i−r​)=i!(−r−i)!(−r)!​=i!(−r)(−r−1)...(−r−i+1)​
    = ( − 1 ) i      r ( r + 1 ) . . . ( r + i − 1 ) i ! =(-1)^i\;\;\frac{r(r+1)...(r+i-1)}{i!} =(−1)ii!r(r+1)...(r+i−1)​
    = ( − 1 ) i      ( r + i − 1 ) ! ( r − 1 ) ! i ! = ( − 1 ) i      (      i r + i − 1 ) =(-1)^i\;\;\frac{(r+i-1)!}{(r-1)!i!}=(-1)^i\;\;(^{r+i-1}_{\;\;i}) =(−1)i(r−1)!i!(r+i−1)!​=(−1)i(ir+i−1​)

    2.3、负二项分布的特例

    当取负二项分布中的r=1,则负二项分布变为了:
    P ( X = i ) =   ( 0 i ) p ( 1 − p ) i = p ( 1 − p ) i {\Large P(X=i) =\,(^{i}_{0})p(1-p)^i=p(1-p)^i} P(X=i)=(0i​)p(1−p)i=p(1−p)i
    这是一个公比为(1-p)的等比级数,也称为几何级数,这种情况下的分布称为几何分布。

    三、小结

    本文介绍了离散随机变量的超几何分布、负二项分布、几何分布的概念,以及相关的公式推导,从介绍可知,他们与二项分布有密切的关系。

    更多人工智能数学基础请参考专栏《人工智能数学基础》。

    写博不易,敬请支持:

    如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

    关于老猿的付费专栏

    1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
    2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
    3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
    4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

    前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

    对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

    如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

    老猿Python,跟老猿学Python!

    ☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░
  • 相关阅读:
    Flink中的时间和窗口
    后端——模块化、npm、package.json 文件、AJAX(笔试面试题)、MVC
    借助适用于 Android 的 Material 运动效果构建精美的过渡
    Tableau自四部曲_Part1:Tableau介绍与安装
    python自动化测试面试题(三)(持续更新)
    qemu sriov
    大学迷茫怎么办?
    猿创征文| Mybatis报错原因和解决方法:Invalid bound statement (not found): com.xxx.mapper.xxx
    2023-10 字节跳动面试整个过程 golang营销服务开发岗位
    线程 相关
  • 原文地址:https://blog.csdn.net/LaoYuanPython/article/details/127929062
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号