FPPW:false positives per window
FPPW 这个指标最早出现在文章 《Histograms of Oriented Gradients for Human Detection》中,也就是经典的行人检测算法 - “HOG + SVM算法” 的文章中,作为评价行人检测的指标。
HOG + SVM算法 检测行人过程大概如下:
(1)输入一张待检测的图片
(2)首先用滑窗法,用检测框(window)选取图片上的某一块区域
(3)提取这个区域的HOG特征
(4)将HOG特征输入SVM中,利用SVM进行分类,判断是否为行人
通过上面的过程我们可以了解到,SVM 是作为分类器而使用的;为了要检测到不同size的行人,需要在滑窗法中用很多不同size的窗口去滑动,每滑动一次,就对应一个window,因此诞生了很多window,每个window都对应一个SVM的预测结果。
对于一张图片来说,我们关注的是SVM是否能够对这些window判断准确。
所以,用 FPPW = f a l s e p o s i t i v e t h e n u m b e r o f w i n d o w \frac{false\ positive}{the\ number\ of\ window} the number of windowfalse positive 来评估 SVM 的检测性能如何
用行人检测任务举例,其包括两个步骤:
(1)用检测框在图像中框出来多块区域
(2)用分类器 分别判断这多个检测框中是否有行人(有1, 无0)
这里我们关注第二个部分,分类器对检测框的判别效果:分类器在判别检测框中的图像是否是行人时,判别结果是否准确。
分类器分类结果有如下4种情况:
1)True Positive : ground truth为【有】,检测结果为 【有】
2)False Negative : ground truth为【有】,检测结果为 【无】
3)False Positive : ground truth为【无】,检测结果为 【有】
4)True Negative : ground truth为【无】,检测结果为 【无】

所有检测框的数量:the number of window = True Positive +False Negative + False Positive + True Negative
真实有行人的数量:Positive = True Positive +False Negative
召回率:recall = T r u e P o s i t i v e P o s i t i v e \frac{True\ Positive}{Positive} PositiveTrue Positive = T r u e P o s i t i v e T r u e P o s i t i v e + F a l s e N e g a t i v e \frac{True Positive}{True\ Positive +False\ Negative} True Positive+False NegativeTruePositive
漏检率:miss rate = f a l s e n e g a t i v e p o s i t v e \frac{false\ negative}{positve} positvefalse negative = F a l s e N e g a t i v e T r u e P o s i t i v e + F a l s e N e g a t i v e \frac{False\ Negative}{True Positive + False\ Negative} TruePositive+False NegativeFalse Negative = 1 - recall
错检率:FPPW = F a l s e P o s i t i v e t h e n u m b e r o f w i n d o w = F a l s e P o s i t i v e T r u e P o s i t i v e + F a l s e N e g a t i v e + F a l s e P o s i t i v e + T r u e N e g a t i v e \frac{False\ Positive}{the\ number\ of\ window} = \frac{False\ Positive}{True\ Positive + False\ Negative + False\ Positive + True\ Negative} the number of windowFalse Positive=True Positive+False Negative+False Positive+True NegativeFalse Positive
(1)那如何得到多个miss rate与fppw值呢?
这和ROC曲线的套路比较类似,即通过调整检测器的阈值,来得到一系列的miss rate 与 FPPW。
即,一个阈值对应一个坐标轴上的 【FPPW, miss rate】点
阈值越高,会使得只有置信度越高的检测框才能被认为是检测器的输出(检测结果是 positive),所以输出的检测框会越少、检测的准确,这也会导致漏检概率越大(置信度低的true positive变为了false negative),此时 miss rate增加,fppw减少。反之同理。
(2)那如何调整检测器的阈值呢?
(从一张图片中框出多个window 和 从多张图片中框出多个window 的调整方式一致)
首先,选择一个适当的阈值,用检测器检测出所有图片的结果,放在一起,按照置信度由高到低排序,然后按照置信度的高低来调整检测的阈值,由此就得到了一系列的miss rate 与 fppw。
