• 【HOG】HOG 之FPPW


    1、简介

    FPPW:false positives per window

    FPPW 这个指标最早出现在文章 《Histograms of Oriented Gradients for Human Detection》中,也就是经典的行人检测算法 - “HOG + SVM算法” 的文章中,作为评价行人检测的指标。


    2、HOG + SVM算法 背景简介

    HOG + SVM算法 检测行人过程大概如下:
    (1)输入一张待检测的图片
    (2)首先用滑窗法,用检测框(window)选取图片上的某一块区域
    (3)提取这个区域的HOG特征
    (4)将HOG特征输入SVM中,利用SVM进行分类,判断是否为行人

    通过上面的过程我们可以了解到,SVM 是作为分类器而使用的;为了要检测到不同size的行人,需要在滑窗法中用很多不同size的窗口去滑动,每滑动一次,就对应一个window,因此诞生了很多window,每个window都对应一个SVM的预测结果。

    对于一张图片来说,我们关注的是SVM是否能够对这些window判断准确。

    • false positive 表示 “没有行人的窗口被误判为了有行人” 的窗口数量
    • the number of window 表示所有窗口的数量

    所以,用 FPPW = f a l s e   p o s i t i v e t h e   n u m b e r   o f   w i n d o w \frac{false\ positive}{the\ number\ of\ window} the number of windowfalse positive 来评估 SVM 的检测性能如何


    3、FPPW:false positives per window

    用行人检测任务举例,其包括两个步骤:
    (1)用检测框在图像中框出来多块区域
    (2)用分类器 分别判断这多个检测框中是否有行人(有1, 无0)
    这里我们关注第二个部分,分类器对检测框的判别效果:分类器在判别检测框中的图像是否是行人时,判别结果是否准确。

    分类器分类结果有如下4种情况:
    1)True Positive : ground truth为【有】,检测结果为 【有】
    2)False Negative : ground truth为【有】,检测结果为 【无】
    3)False Positive : ground truth为【无】,检测结果为 【有】
    4)True Negative : ground truth为【无】,检测结果为 【无】

    在这里插入图片描述

    所有检测框的数量:the number of window = True Positive +False Negative + False Positive + True Negative

    真实有行人的数量:Positive = True Positive +False Negative

    召回率:recall = T r u e   P o s i t i v e P o s i t i v e \frac{True\ Positive}{Positive} PositiveTrue Positive = T r u e P o s i t i v e T r u e   P o s i t i v e + F a l s e   N e g a t i v e \frac{True Positive}{True\ Positive +False\ Negative} True Positive+False NegativeTruePositive

    漏检率:miss rate = f a l s e   n e g a t i v e p o s i t v e \frac{false\ negative}{positve} positvefalse negative = F a l s e   N e g a t i v e T r u e P o s i t i v e + F a l s e   N e g a t i v e \frac{False\ Negative}{True Positive + False\ Negative} TruePositive+False NegativeFalse Negative = 1 - recall

    错检率:FPPW = F a l s e   P o s i t i v e t h e   n u m b e r   o f   w i n d o w = F a l s e   P o s i t i v e T r u e   P o s i t i v e + F a l s e   N e g a t i v e + F a l s e   P o s i t i v e + T r u e   N e g a t i v e \frac{False\ Positive}{the\ number\ of\ window} = \frac{False\ Positive}{True\ Positive + False\ Negative + False\ Positive + True\ Negative} the number of windowFalse Positive=True Positive+False Negative+False Positive+True NegativeFalse Positive

    分类器评估标准参考


    4、miss rate versus false positives per window

    (1)那如何得到多个miss rate与fppw值呢?
    这和ROC曲线的套路比较类似,即通过调整检测器的阈值,来得到一系列的miss rate 与 FPPW。
    即,一个阈值对应一个坐标轴上的 【FPPW, miss rate】点

    阈值越高,会使得只有置信度越高的检测框才能被认为是检测器的输出(检测结果是 positive),所以输出的检测框会越少、检测的准确,这也会导致漏检概率越大(置信度低的true positive变为了false negative),此时 miss rate增加,fppw减少。反之同理。

    (2)那如何调整检测器的阈值呢?
    (从一张图片中框出多个window 和 从多张图片中框出多个window 的调整方式一致)
    首先,选择一个适当的阈值,用检测器检测出所有图片的结果,放在一起,按照置信度由高到低排序,然后按照置信度的高低来调整检测的阈值,由此就得到了一系列的miss rate 与 fppw。

    在这里插入图片描述

  • 相关阅读:
    vs2017打开工程提示若要解决此问题,请使用以下选择启动 Visual Studio 安装程序: 用于 x86 和 x64 的 Visual C++ MFC
    部署elasticsearch集群
    [附源码]JAVA毕业设计课程在线反馈系统(系统+LW)
    【基础教程】Matlab创建三维箱线图
    Codeforces Round #425 (Div. 2) D 题解
    NPDP怎么报名?考试难度大吗?
    使用 COPY 加速 PostgreSQL 批量插入
    VS Code调试使用标准输入功能的go程序的问题
    第6篇 vue的打包工具webpack
    NumPy 差分、最小公倍数、最大公约数、三角函数详解
  • 原文地址:https://blog.csdn.net/weixin_37804469/article/details/127580207