关于先验框,有的paper(如Faster RCNN)中称之为anchor(锚点),有的paper(如SSD)称之为prior bounding box(先验框),实际上是一个概念。
对于目标检测任务,有这样一种经典解决方案:遍历输入图像上所有可能的像素框,然后选出正确的目标框,并对位置和大小进行调整就可以完成目标检测任务。这些进行预测的像素框就叫锚框。这些锚框通常都是方形的。同时,为了增加任务成功的几率,通常会在同一位置设置不同宽高比的锚框。
上图为 Anchor box 与 bounding box 转换示意图,其中蓝色的是要预测的bounding box,黑色虚线框是Anchor box。
tx、ty、tw、th为特征网络的输出值,Cx,Cy为中心点所在网格左上角的坐标,Pw,Ph为给定先验框的宽高
tx、ty为预测框相对于先验框中心点的偏移
利用tw、th调整先验框来获得预测框