• 查准率(precision,也叫精确率)和查全率(recall,也叫召回率)


    精确率召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率

    查准率和查全率是一对相互制约的度量指标。

    一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是精确的,Recall就是所有精确的条目有多少被检索出来了。

    精确率、召回率和 F 值是在鱼龙混杂的环境中,选出目标的重要评价指标。不妨看看这些指标的定义先:

    1. 精确率 = 提取出的正确信息条数 / 提取出的信息条数

    即,精确率 = 

    2. 召回率 = 提取出的正确信息条数 / 样本中正确的信息条数

    即,召回率 = 

    两者取值在0和1之间,数值越接近1,查准率或查全率就越高。

    3. F值 = 精确率 * 召回率 * 2 / (精确率 + 召回率) (F 值即为精确率和召回率的调和平均值)

    不妨举这样一个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:

    精确率 = 700 / (700 + 200 + 100) = 70%

    召回率 = 700 / 1400 = 50%

    F值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

    不妨看看如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,这些指标又有何变化:

    精确率 = 1400 / (1400 + 300 + 300) = 70%

    召回率 = 1400 / 1400 = 100%

    F值 = 70% * 100% * 2 / (70% + 100%) = 82.35%

    由此可见,精确率是评估捕获的成果中目标成果所占得比例;召回率,顾名思义,就是从关注领域中,召回目标类别的比例;而F值,则是综合这二者指标的评估指标,用于综合反映整体的指标。

    当然希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。比如极端情况下,我们只搜索出了一个结果,且是精确的,那么Precision就是100%,但是Recall就很低;而如果我们把所有结果都返回,那么比如Recall是100%,但是Precision就会很低。因此在不同的场合中需要自己判断希望Precision比较高或是Recall比较高。如果是做实验研究,可以绘制Precision-Recall曲线来帮助分析。

  • 相关阅读:
    一级建造师有哪些答题技巧
    npm install err 4058报错处理
    OpenHarmony-4.0-Release 源码编译记录
    Py之pygraphviz:pygraphviz的简介、安装、使用方法之详细攻略
    【微积分】算法数学基础之微积分
    HarmonyOS学习路之方舟开发框架—学习ArkTS语言(状态管理 七)
    【C++初阶】小白入门C++
    office2019在保存的时候报错
    存储介质中ext4的文件排布
    HTML5期末大作业商城网页设计与实:(手表 3页)HTML+CSS
  • 原文地址:https://blog.csdn.net/npk191954/article/details/133270267