码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 朴素贝叶斯


    12. 朴素贝叶斯

    文章目录

      • 12. 朴素贝叶斯
        • 12.1 简介
        • 12.2 概率基础
          • 12.2.1 概率定义
          • 12.2.2 联合概率
          • 12.2.3 条件概率
          • 12.2.4 相互独立
          • 12.2.5 贝叶斯公式
          • 12.2.6 朴素贝叶斯
        • 12.3 API
        • 12.4 算法总结
          • 12.4.1 优点
          • 12.4.2 缺点
          • 12.4.3 NB原理
          • 12.4.4 为什么朴素
          • 12.4.5 为什么引入条件独立性假设
          • 12.4.6 在估计条件概率P(X∣Y)时出现概率为0的情况怎么办
          • 12.4.7 朴素贝叶斯与LR的区别

    12.1 简介

    分类

    • 在这里插入图片描述

    • 在这里插入图片描述

    12.2 概率基础

    12.2.1 概率定义

    • 一件事情发生的可能性
    • P(X) : 取值在[0, 1]

    12.2.2 联合概率

    • 包含多个条件,且所有条件同时成立的概率
    • 记作:P(A,B)

    12.2.3 条件概率

    • 事件A在另外一个事件B已经发生条件下的发生概率
    • 记作:P(A|B)

    12.2.4 相互独立

    • 如果P(A, B) = P(A)P(B),则称事件A与事件B相互独立

    12.2.5 贝叶斯公式

    • 在这里插入图片描述

    12.2.6 朴素贝叶斯

    • 假定了特征与特征之间相互独立的贝叶斯公式

    12.3 API

    sklearn.naive_bayes.MultinomialNB(alpha = 1.0)

    • 朴素贝叶斯分类
    • alpha:拉普拉斯平滑系数

    12.4 算法总结

    12.4.1 优点

    • 朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
    • 对缺失数据不太敏感,算法也比较简单,常用于文本分类
    • 分类准确度高,速度快

    12.4.2 缺点

    • 由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好
    • 需要计算先验概率,而先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳

    12.4.3 NB原理

    • 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法

      • 对于给定的待分类项xx,通过学习到的模型计算后验概率分布,
      • 即:在此项出现的条件下各个目标类别出现的概率,将后验概率最大的类作为xx所属的类别。

    12.4.4 为什么朴素

    • 在计算条件概率分布P(X=x∣Y=c_k)时,NB引入了一个很强的条件独立假设,即,当Y确定时,X的各个特征分量取值之间相互独立

    12.4.5 为什么引入条件独立性假设

    • 为了避免贝叶斯定理求解时面临的组合爆炸、样本稀疏问题

    12.4.6 在估计条件概率P(X∣Y)时出现概率为0的情况怎么办

    • 引入λ

      • 当λ=0时,就是普通的极大似然估计
      • 当λ=1时称为拉普拉斯平滑

    12.4.7 朴素贝叶斯与LR的区别

    • 一

      • 朴素贝叶斯是生成模型
      • LR是判别模型
    • 二

      • 朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的)
      • LR则对此没有要求
    • 三

      • 朴素贝叶斯适用于数据集少的情景
      • LR适用于大规模数据集
  • 相关阅读:
    Excelize 发布 2.6.1 版本,支持工作簿加密
    手把手教你做个智能加湿器(一)
    mysql升级
    2023年跨境独立站电商的未来趋势,fecify引领独立站的制胜法宝。
    设计模式之工厂模式
    5_SqlSugar实体中的细节
    【算法与数据结构】二叉树的三种遍历代码实现(下)—— 非递归方式实现(大量图解)
    java-net-php-python-springboot家政服务平台计算机毕业设计程序
    服务端技术方案应该具有哪些章节
    三一充填泵:煤矿矸石无害化充填,煤炭绿色高效开采的破局利器
  • 原文地址:https://blog.csdn.net/weixin_44226181/article/details/126170403
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号