• 机器学习课后习题 --- 朴素贝叶斯


    (一)单选题

    1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少?
    A:80%
    B:16.6%
    C:23%
    D:15%
     

    2.下列关于朴素贝叶斯的特点说法错误的是()
    A:朴素贝叶斯模型发源于古典数学理论,数学基础坚实
    B:朴素贝叶斯模型无需假设特征条件独立
    C:朴素贝叶斯处理过程简单,分类速度快
    D:朴素贝叶斯对小规模数据表现较好
     

    3.以下算法不属于生成模型 ( )
    A:朴素贝叶斯模型
    B:混合高斯模型
    C:隐马尔科夫模型
    D:支持向量机
     

    4.关于拉普拉斯平滑说法正确的是()
    A:避免了出现概率为0的情况
    B:加上拉普拉斯平滑有助于提高学习性能
    C:会使得最终结果可能大于1
    D:以上说法都不对
     

    5.假设X和Y都服从正态分布,那么P(X<5,Y<0)就是一个( ),表示X<5,Y<0两个条件同时成立的概率,即两个事件共同发生的概率。
    A:先验概率
    B:后验概率
    C:联合概率
    D:以上说法都不对
     

    6.以下算法属于判别模型的是( )
    A:朴素贝叶斯模型
    B:深度信念网络
    C:隐马尔科夫模型
    D:线性回归
     

    7.以下算法属于判别模型的是()

    A:朴素贝叶斯模型
    B:深度信念网络
    C:隐马尔科夫模型
    D:线性回归

    8. 朴素贝叶斯的优点不包括( )
    A:算法逻辑简单,易于实现
    B:分类过程中时空开销小
    C:对缺失数据不太敏感,算法也比较简单,常用于文本分类
    D:朴素贝叶斯模型对输入数据的表达形式很敏感
     

    9.市场上某商品来自两个工厂,它们市场占有率分别为60%和40%,有两人各自买一件,则买到的来自不同工厂之概率为( )。
    A:0.5
    B:0.24
    C:0.48
    D:0.3
     

    10.以A表示事件"甲种产品畅销,乙种产品滞销",则其对立事件A为( ) 
    A:甲种产品滞销,乙种产品畅销
    B:甲,乙两种产品均畅销
    C:甲种产品滞销
    D:甲种产品滞销或乙种产品畅销

    11.关于朴素贝叶斯,下列说法错误的是:( )
    A:它是一个分类算法
    B:朴素的意义在于它的一个天真的假设:所有特征之间是相互独立的
    C:它实际上是将多条件下的条件概率转换成了单一条件下的条件概率,简化了计算
    D:朴素贝叶斯不需要使用联合概率
     

    12.掷二枚骰子,事件A为出现的点数之和等于3的概率为( )
    A:1/11
    B:1/18
    C:1/6
    D:都不对
     

    12、 问题:公司里有一个人穿了运动鞋,推测是男还是女?已知公司里男性30人,女性70人,男性穿运动鞋的有25人,穿拖鞋的有5人,女性穿运动鞋的有40人,穿高跟鞋的有30人。则以下哪项计算错误()?
    选项:
    A:p(男|运动鞋)=0.25
    B:p(女|运动鞋)=0.4
    C:p(运动鞋|男性)=25/30
    D:p(运动鞋|女性)=0.4
     

    (二)判断题

    1.根据以往经验和分析得到的概率。在这里,我们用P(Y)来代表在没有训练数据前假设Y拥有的初始概率,因此称其为Y的后验概率,它反映了我们所拥有的关于Y的背景知识。
    答案: 【错误】

    2.朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性相关性较小时,朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时,分类效果不好。
    答案: 【正确】

    15.朴素贝叶斯对缺失数据较敏感。
    答案: 【正确】

    16.判别模型所学内容是决策边界。
    答案: 【正确】

    17.逻辑回归是生成模型,朴素贝叶斯是判别模型
    答案: 【错误】

    18、 问题:逻辑回归和朴素贝叶斯都有对属性特征独立的要求
    答案: 【错误】

    19、 问题:朴素贝叶斯法的基本假设是条件独立性。 
    答案: 【正确】

    20、 问题:朴素贝叶斯适用于小规模数据集,逻辑回归适用于大规模数据集。
    答案: 【错误】
     

    (三)问答题

    1.朴素贝叶斯与逻辑回归的区别是什么?

    定义与原理

    逻辑回归:是一个用于预测目标变量为二分类或多分类的概率的线性模型。

    朴素贝叶斯:是基于贝叶斯定理和特定假设(特征之间相互独立)的一种分类方法。

    假设与模型

    逻辑回归:假设特征与输出log-odds之间存在线性关系。

    朴素贝叶斯:假设特征之间是条件独立的,即给定目标值时,一个特征的存在不会影响其他特征的存在。

    适用场景

    逻辑回归:当特征与输出之间的关系可以近似为线性关系时,逻辑回归通常表现得较好。

    朴素贝叶斯:在文本分类、垃圾邮件识别等需要特征独立性假设的场景中表现良好。

    参数估计

    逻辑回归:通常使用极大似然估计来确定参数。

    朴素贝叶斯:使用先验概率和似然来估计后验概率。

    模型表现

    逻辑回归:当特征数量很大或存在多重共线性时,可能需要正则化来防止过拟合。

    朴素贝叶斯:虽然其“朴素”的假设在许多实际应用中不成立,但它在许多情况下仍然表现得很好。

    实际应用

    逻辑回归:广泛应用于金融、医疗、社交媒体等领域的分类问题。

    朴素贝叶斯:在文本处理、情感分析、垃圾邮件过滤等领域有广泛的应用。

    2.朴素贝叶斯“朴素”在哪里?

            朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,它的名称中的“朴素”是指其一个核心假设:特征之间是条件独立的。即给定类别标签后,一个特征的出现不会影响其他特征的出现。“朴素”是假设了特征之间是同等重要、相互独立、互不影响的,但是在我们的现实社会中,属性之间并不是都是互相独立的,有些属性也会存在性,所以说朴素贝叶斯是一种很“朴素”的算法。

            具体来说,在许多实际情况中,特征之间确实存在某种依赖关系或关联。例如,在文本分类中,某些词的出现可能与其他词的出现有关。然而,尽管这个假设看起来过于简化,朴素贝叶斯分类器在很多应用中都表现得相当好。

            这个简化的假设带来了计算上的便利性。假设特征是条件独立的,意味着我们可以简单地将每个特征的概率相乘,而不需要担心它们之间的复杂交互。

            总的来说,“朴素”在朴素贝叶斯中是指它对特征间关系的简化假设,即认为所有特征都是条件独立的。这是一个在很多实际情况下并不完全成立的假设,但这种方法经常在实际应用中得到令人满意的结果。

    3.在估计条件概率P((X|Y)时出现概率为0的情况怎么办?

    引入拉普拉斯平滑法

    4.何为朴素贝叶斯?

          朴素贝叶斯是一种简单但强大的分类算法,它基于贝叶斯定理并考虑到了特征的条件独立性。朴素贝叶斯被广泛应用于垃圾邮件检测、文本分类、情感分析等任务。

     补充:

    贝叶斯定理: 贝叶斯定理描述了随机事件A和B之间的概率关系。数学表示为:  P(A∣B)=P(B)P(B∣A)P(A)​ 在分类任务中, A 通常是类别标签,而  B 是给定的数据或特征。

    特征的条件独立性: 朴素贝叶斯分类器的“朴素”之处在于它假设给定类别标签后,所有特征都是条件独立的。这意味着,如果你有一个数据点的多个特征,那么这些特征之间不会相互影响。这种假设简化了计算,尽管在现实世界中,特征间可能存在关联。

    模型训练: 为了训练一个朴素贝叶斯分类器,你首先需要计算每个类别的先验概率(即在没有任何其他信息的情况下某个类别出现的概率),以及给定某个类别时每个特征的概率。

    预测: 对于一个新的数据点,朴素贝叶斯分类器计算它属于每个类别的后验概率,并选择概率最高的类别作为预测结果。

    应用场景: 朴素贝叶斯在特定的应用中效果非常好,特别是在文本分类任务中。例如,判断一封电子邮件是不是垃圾邮件、对产品评论进行情感分析等。

           总之,朴素贝叶斯是一个基于贝叶斯定理的分类方法,其“朴素”是因为它假设所有特征在给定类别标签的条件下是独立的。尽管这种假设在许多真实情境中并不完全成立,但朴素贝叶斯在很多任务上都能得到相当不错的结果。

  • 相关阅读:
    Spring创建和使用
    HTTP 请求中的请求方法有哪些常见的类型?
    好奇喵 | Tor浏览器——访问.onion网址,揭开Dark Web的神秘面纱
    DeepMind 的新强化学习系统是迈向通用 AI 的一步吗?
    【Spring面试】Spring事务(图文详解)
    基于mindspore的大模型llama2-7b---微调/推理
    基于SWAT-MODFLOW地表水与地下水耦合
    基于内容的推荐系统算法
    STM32CubeIDE 操作 LCD1602
    Kafka系列之:NoBrokersAvailable和Failed to update metadata after 60.0 secs.
  • 原文地址:https://blog.csdn.net/qq_63976098/article/details/132661091