• plt函数显示图片 & 在图片上画边界框 & 边界框坐标转换


    一.读取图片并显示图片

    %matplotlib inline
    import torch
    from d2l import torch as d2l
    
    • 1
    • 2
    • 3
    '''读取图片'''
    image_path = '../data/images/cat_dog_new.jpg'
    # 创建画板
    figure = d2l.set_figsize()
    image = d2l.plt.imread(image_path)
    d2l.plt.imshow(image);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述

    二.给出一个(x左上角,y左上角,x右下角,y右下角)类型的框,在图片上画出该框

    '''边界框'''
    box = (60,50,460,510)
    
    • 1
    • 2
    def bbox_to_rect(bbox, color):
        # 将边界框(左上x,左上y,右下x,右下y)格式转换成matplotlib格式:
        # ((左上x,左上y),宽,高)
        return d2l.plt.Rectangle(
            xy=(bbox[0], bbox[1]), width=bbox[2]-bbox[0], height=bbox[3]-bbox[1],
            fill=False, edgecolor=color, linewidth=2)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    # 返回一个画布,该画布上面有图画image
    fig = d2l.plt.imshow(image)
    # 在该画布上画一个矩形框
    fig.axes.add_patch(bbox_to_rect(box,'red'));
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    三. 边界框坐标转换

    3.1 左上角右下角格式的坐标 --> 边界框中心坐标,框的高和宽

    原:(x1,y1,x2,y2)
    w = x2-x1
    h = y2-y1
    中心坐标 = (x1+w/2,y1+h/2)

    def box_corner_to_center(boxes):
        # 因为以后boxes可能不止一个,所以 boxes[:,0]取出所有行的第一列
        x1,y1,x2,y2 = boxes[:,0],boxes[:,1],boxes[:,2],boxes[:,3]
        w = x2-x1
        h = y2-y1
        x_center,y_center = x1 + w/2, y1 + h/2
        # axis=-1表示在最后一个维度上进行堆叠
        boxes = torch.stack((x_center,y_center,w,h),axis = -1)
        return boxes
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    创建两个左上角走下角格式的坐标boxes

    dog_bbox, cat_bbox = [60.0, 45.0, 378.0, 516.0], [400.0, 112.0, 655.0, 493.0]
    boxes = torch.tensor((dog_bbox,cat_bbox))
    print(boxes)
    boxes.shape
    
    • 1
    • 2
    • 3
    • 4
    tensor([[ 60.,  45., 378., 516.],
            [400., 112., 655., 493.]])
    
    torch.Size([2, 4])
    
    • 1
    • 2
    • 3
    • 4

    运行结果

    box_corner_to_center(boxes)
    
    • 1
    tensor([[219.0000, 280.5000, 471.0000, 318.0000],
            [527.5000, 302.5000, 381.0000, 255.0000]])
    torch.Size([2, 4])
    
    • 1
    • 2
    • 3

    3.2 边界框中心坐标,框的高和宽 --> 左上角右下角格式的坐标

    原:(x_center,y_center,w,h)
    x1 = x_center - 0.5w
    y1 = y_center - 0.5
    h
    x2 = x_center + 0.5w
    y2 = y_center + 0.5
    h

    def box_center_to_corner(boxes):
        x_center,y_center,w,h = boxes[:,0],boxes[:,1],boxes[:,2],boxes[:,3]
        x1,y1= x_center-0.5*w , y_center-0.5*h
        x2,y2= x_center+0.5*w , y_center+0.5*h
        boxes = torch.stack((x1,y1,x2,y2),axis=-1)
        return boxes
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    boxes = box_center_to_corner(boxes)
    print(boxes)
    boxes.shape
    
    • 1
    • 2
    • 3
    tensor([[ 60.,  45., 378., 516.],
            [400., 112., 655., 493.]])
    
    torch.Size([2, 4])
    
    • 1
    • 2
    • 3
    • 4
  • 相关阅读:
    python:绘制回归预测结果真实值和预测值之间的散点密度图
    Log4j 漏洞引发全球修补漏洞行动;KeePassX 停止开发;.NET 6 网络改进 | 开源日报
    校园失物招领微信小程序(30167)
    上周热点回顾(11.7-11.13)
    Centos7 安装Docker以及图形管理界面
    甘露糖-聚乙二醇-CY5.5 /Cy5.5-PEG-mannose
    bat常规脚本命令(用到才会写,未完待续10/27)
    ArcGIS中各类用地景观干扰度的计算(附土地利用练习数据下载)
    SpringMVC面试题
    Oracle快速入门 | 黑马
  • 原文地址:https://blog.csdn.net/qq_42864343/article/details/132760723