码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【机器学习300问】102、什么是混淆矩阵?


    一、混淆矩阵的定义

            混淆矩阵是一种用于评估分类模型性能的评估指标。当模型对数据进行预测并将数据分配到预定义的类别时,混淆矩阵提供了一种直观的方式来总结这些预测与数据实际类别之间的对应关系。具体来说,它是一个表格。

    二、分类模型性能评估一级指标

    分类模型的性能评估指标有三个等级,一级评估指标如下:

    1. 真正例(True Positives, TP):模型预测为正类,实际上也是正类的样本数。
    2. 假正例(False Positives, FP):模型预测为正类,但实际上为负类的样本数。
    3. 真负例(True Negatives, TN):模型预测为负类,实际上也是负类的样本数。
    4. 假负例(False Negatives, FN):模型预测为负类,但实际上为正类的样本数。

    混淆矩阵就是根据一级分类指标得到的一张表。 

    我自己的理解是三句话:

    第一句:分类你可以理解成猜迷,猜的对不对用“T真,F假”来表示。

    第二句:你猜的这个东西的时候,你猜测它类别是“P正”还是“N负”。

    第三句:你猜的这个东西,它本身的分类用“标签label”表示。

    所以按照上面的三句话理解,举几个例子:

    情况一:这个东西,本来的“标签”是“正”的,我猜它是“正”,意味着我猜对了,故TP。

    情况二:这个东西,本来的“标签”是“负”的,我猜它是“负”,意味着我猜对了,故TN。

    情况三:这个东西,本来的“标签”是“正”的,我猜它是“负”,意味着我猜错了,故FN。

    情况四:这个东西,本来的“标签”是“负”的,我猜它是“正”,意味着我猜错了,故FP。

    二、分类模型性能评估二级指标

            分类模型的二级评估指标在之前的文章中提到过,但没有总结过。因此在本文章简单总结一下:

    四个二级指标
    二级指标公式意义
    准确率(Accuracy)Accuracy=\frac{TP+TN}{TP+TN+FP+FN}分类模型所有判断正确的结果占总观测值的比重
    精确率(Precision)Precision=\frac{TP}{TP+TN}在模型预测是Positive的所有结果中,模型预测对的比重

    召回率(Recall)

    (又叫灵敏度Sensitivity)

    Recall=\frac{TP}{TP+FN}在真实值是Positive的所有结果中,模型预测对的比重
    特异度(Specificity)Specificity=\frac{TN}{TN+FP}在真实值是Negative的所有结果中,模型预测对的比重

    更多更详细的知识点,在往期文章中有提到,下面是跳转链接:

    【机器学习300问】25、常见的模型评估指标有哪些?icon-default.png?t=N7T8https://blog.csdn.net/qq_39780701/article/details/136407056 

    三、分类模型新能评估三级指标

            分类模型的三级评估指标就是F1分数,在之前的文章中提到过。这里就不赘述了。

    【机器学习300问】32、F1分数是什么?icon-default.png?t=N7T8https://blog.csdn.net/qq_39780701/article/details/136607068

    四、混淆矩阵举例说明 

            以一个图片多分类问题为例,想要判断一张图片是“猫”、“狗”和“猪”其中的哪一种。

     混淆矩阵中的数值是样本数量,如果我们要计算准确率accuracy,那么可以统计所有表中数字的总和做分母。对角线相加做分子(因为对角线上的元素代表模型预测结果是正确的)。可以算出accuracy=\frac{10+15+20}{10+1+2+3+15+4+5+6+20}=\frac{45}{66}=0.6818

  • 相关阅读:
    【创建型模式】工厂方法模式
    黑马瑞吉外卖之移动端验证码登录使用qq邮箱
    计算机组成原理知识总结(七)外围设备
    Linux系统安装Anaconda3,并配置pytorch环境
    树莓派——9、IO操控代码编程
    计算机毕业设计ssm基于SSM框架的网上订餐系统r1u1u系统+程序+源码+lw+远程部署
    《面试八股文》之 JVM 20卷
    App移动端测试(1)—— Android sdk部署
    利用大语言模型,矢量数据库实现数据库的智能搜索
    【交易心态】MT4外汇交易秘籍:如何保持冷静应对波动市场?
  • 原文地址:https://blog.csdn.net/qq_39780701/article/details/139269824
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号