• yolov5使用最新MPDIOU损失函数,有效和准确的边界盒回归的损失,优于GIoU/EIoU/CIoU/EIoU(附代码可用)


    1. 论文

    MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression
    (一个有效和准确的边界框损失回归函数)
    论文地址

    1.1. 主要目的

    当预测框与边界框具有相同的纵横比,但宽度和高度值完全不同时,大多数现有的边界框回归损失函数都无法优化。
    为了解决上述问题,MPDIoU充分挖掘水平矩形的几何特征,提出了一种新的基于最小点距离的边界框相似性比较指标MPDIoU,该指标包含了现有损失函数中考虑的所有相关因素,即重叠或不重叠区域、中心点距离、宽度和高度偏差,同时简化了计算过程。
    在这里插入图片描述

    论文中举例了,绿色框为真实目标框,红色框表示预测目标框,两幅图中预测目标框和真实目标框存在相同的长宽比,但是现象是不一致的,一个在真实框内部一个在真实框外部。

    此时GIoU/EIoU/CIoU/EIoU计算结果确实一致,上述用于边界框回归的损失函数将失去有效性,这将限制收敛速度和精度,而MPDIOU能够计算两者的差异,
    因此使用MPDIoU损失函数用于边界框回归,具有更高的边界框回归效率和精度。。

    1.2. 设计思路

    在分析了IOU系列损失函数的优势和劣势之后,开始思考如何提高边界框回归的准确性和效率。
    通常情况下,使用左上角和右下角点的坐标来定义一个唯一的矩形。受到边界框几何特性的启发,作者设计了一种新颖的基于交并比的度量标准,名为MPDIoU,直接最小化预测边界框与实际标注边界框之间的左上角和右下角点距离。
    综上所述,提出的MPDIoU简化了两个边界框之间的相似性比较,可以适应重叠或非重叠的边界框回归。

    在训练阶段,通过最小化以下损失函数,使得模型预测的每个边界框Bprd = [xprd, yprd, wprd, hprd]T趋近于其对应的真实标注边界框Bgt = [xgt, ygt, wgt, hgt]T:
    在这里插入图片描述
    因此,现有边界框回归损失函数的所有因素都可以通过4个点的坐标来确定。转换公式如下所示:
    在这里插入图片描述
    在上述公式中, |C|表示覆盖Bgt和Bprd的最小外接矩形的面积,\left (x_{c}{gt},y_{c}{gt} \right )
    \left (x_{c}{prd},y_{c}{prd} \right )
    分别表示真实标注边界框和预测边界框的中心点坐标。w_gt和h_gt表示真实标注边界框的宽度和高度,w_prd和h_prd表示预测边界框的宽度和高度。

    从公式中可以发现所有现有损失函数中考虑的因素都可以通过左上角点和右下角点的坐标来确定,例如非重叠面积、中心点距离、宽度和高度的偏差,这意味着作者提出的L_MPDIoU不仅考虑全面,还简化了计算过程。

    MPDIoU的计算过程如下:
    在这里插入图片描述MPDIoU作为损失函数的计算过程如下:
    在这里插入图片描述在这里插入图片描述
    上图表示MPDIOU损失函数的参数

    2 代码

    在metrics.py中修改bbox_iou函数

    def bbox_iou(box1, box2, hw=None, xywh=True, GIoU=False, DIoU=False, CIoU=False, EIoU=False,
                 MPDIoU=False, eps=1e-7):
        # Returns Intersection over Union (IoU) of box1(1,4) to box2(n,4)
    
        # Get the coordinates of bounding boxes
        if xywh:  # transform from xywh to xyxy
            (x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, 1), box2.chunk(4, 1)
            w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2
            b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_
            b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_
        else:  # x1, y1, x2, y2 = box1
            b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, 1)
            b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, 1)
            w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1 + eps
            w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1 + eps
    
        # Intersection area
        inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \
                (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0)
    
        # Union Area
        union = w1 * h1 + w2 * h2 - inter + eps
    
        # IoU
        iou = inter / union
        if GIoU or CIoU or DIoU or EIoU or MPDIoU:
            cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1)  # convex (smallest enclosing box) width
            ch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1)  # convex height
            if CIoU or DIoU or EIoU or MPDIoU:  # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1
                c2 = cw ** 2 + ch ** 2 + eps  # convex diagonal squared 中心点平方
                rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (
                        b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4  # center dist ** 2 中心点距离
                if CIoU:  # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47
                    v = (4 / math.pi ** 2) * torch.pow(torch.atan(w2 / h2) - torch.atan(w1 / h1), 2)
                    with torch.no_grad():
                        alpha = v / (v - iou + (1 + eps))
                    return iou - (rho2 / c2 + v * alpha)  # CIoU
                elif EIoU:
                    rho_w2 = ((b2_x2 - b2_x1) - (b1_x2 - b1_x1)) ** 2
                    rho_h2 = ((b2_y2 - b2_y1) - (b1_y2 - b1_y1)) ** 2
                    cw2 = cw ** 2 + eps
                    ch2 = ch ** 2 + eps
                    return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2)  # EIoU
                elif DIoU:
                    return iou - rho2 / c2  # DIoU
                elif MPDIoU:
                    # union = w1 * h1 + w2 * h2 - inter + eps
                    mpd_d1 = (b1_x1 - b2_x1) ** 2 + (b1_y1 - b2_y1) ** 2
                    mpd_d2 = (b1_x2 - b2_x2) ** 2 + (b1_y2 - b2_y2) ** 2
                    # mpd_d = image_size[0] ** 2 + image_size[1] ** 2
                    return inter / union - mpd_d1 / hw - mpd_d2 / hw
    
            c_area = cw * ch + eps  # convex area
            return iou - (c_area - union) / c_area  # GIoU https://arxiv.org/pdf/1902.09630.pdf
        return iou  # IoU
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55

    在loss.py中修改class ComputeLoss类中的def call(self, p, targets):函数

    # iou = bbox_iou(pbox, tbox[i], EIoU=True).squeeze() 将这行改成如下
    iou = bbox_iou(pbox, tbox[i], hw=tobj.size()[2]**2 + tobj.size()[3]**2, MPDIoU=True).squeeze()
    
    • 1
    • 2

    3.总结

    MPDIOU 能够有效解决重叠和包含问题,并且能够有效地处理预测框和目标框长宽比相同的情况,而且计算量小,模型训练速度快。
    在数据集上测试和验证,发现能够提升训练精度,并且有效地区分两个目标存在包含的关系的预测框回归,推荐大家使用MPDIOU 进行训练。

    强烈建议大家阅读一下原文,有效地加深和理解GIoU/EIoU/CIoU/EIoU

  • 相关阅读:
    JDBC的事务自动提交机制的演示
    多媒体数据处理实验4:LSH索引
    别看了,这就是你的题呀(三)
    【广州华锐互动】动物内脏3D模型素材库提供更加丰富的学习资源,提高教学效果
    MySQL read 查询语句4 数学相关函数
    C陷阱与缺陷 第6章 预处理器 6.2 宏并不是函数
    怎么在 OJ 上用 JavaScript 写算法题,赶快学起来~
    不再使用步长卷积或池化:针对低分辨率图像和小物体的新的CNN构建块
    《golang设计模式》第二部分·结构型模式-06-享元模式(Flyweight)
    论文浅尝 | 探索用于归纳型知识图谱补全的关系语义
  • 原文地址:https://blog.csdn.net/qq_42754919/article/details/132990747