• MaxPool2d详解--在数组和图像中的应用


    1、环境要求

    1、需要安装Pytorch依赖
    2、官方文档conv2d
    3、图片需要CIFAR10数据集

    2、原理讲解

    用卷积核覆盖在原始数据上,选择原始数据中被卷积核覆盖的最大值

    在这里插入图片描述
    选择卷积核覆盖时的最大值,ceil_mode控制卷积核超出原始数据后是否进行保留

    3、函数要求

    函数:
    在这里插入图片描述
    参数要求
    在这里插入图片描述

    kernel_size设置卷积核大小的属性
    stride和conv2d中的stride一样,是控制移动步幅的属性,这里注意,conv2d默认值是1,但是MaxPool2d默认值是卷积核大小
    padding设置原始数据周围填充的属性
    dilation:表明给原始数据之间添加0的属性
    ceil_mode控制当卷积核超过原始图像时,是否对max进行保留

    4、例子

    4.1、数组

    代码:

    import torch
    import torchvision
    
    from torch.nn import Module,MaxPool2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    input = torch.tensor([[1,2,0,3,1],
                          [0,1,2,3,1],
                          [1,2,1,0,0],
                          [5,2,3,1,1],
                          [2,1,0,1,1]],dtype=torch.float32)
    
    print("前",input.shape)      # torch.Size([5, 5]),不满足输入的条件,需要进行格式转换
    
    input = torch.reshape(input,(-1,1,5,5))
    
    print("后",input.shape)    # 后 torch.Size([1, 1, 5, 5]) 一个bach_size,
    
    class ConNet(Module):
        def __init__(self):
            super(ConNet, self).__init__()
            # 池化层使用,设置卷积核为3*3,超出的部分保留数据
            self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)
    
        def forward(self,input):
            output = self.maxpool(input)
            return output
    
    # 实例化对象
    Work = ConNet()
    
    # 神经网络调用
    output = Work(input)
    print(output)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35

    结果:
    在这里插入图片描述

    4.2、图像

    代码:

    
    import torch
    import torchvision
    
    from torch.nn import Module,MaxPool2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    class ConNet(Module):
        def __init__(self):
            super(ConNet, self).__init__()
            # 池化层使用,设置卷积核为3*3,超出的部分保留数据
            self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)
    
        def forward(self,input):
            output = self.maxpool(input)
            return output
    
    # 实例化对象
    Work = ConNet()
    
    # CIFAR10数据使用
    dataset = torchvision.datasets.CIFAR10("./datasetvision",train=False,download=False,transform=torchvision.transforms.ToTensor())
    
    # 数据加载
    dataloader = DataLoader(dataset,batch_size=64)
    
    writer = SummaryWriter("logs_MaxPool")
    
    step = 0
    for data in dataloader:
        imgs,target = data
        writer.add_images("input",imgs,step)
        output = Work(imgs)
        writer.add_images("output",output,step)
        step = step + 1
    
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38

    结果:
    在这里插入图片描述
    在这里插入图片描述

    4.3、Conv2d+MaxPool2d图像

    代码:

    
    import torch
    import torchvision
    
    from torch.nn import Module,MaxPool2d,Conv2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    class ConNet(Module):
        def __init__(self):
            super(ConNet, self).__init__()
            # 池化层使用,设置卷积核为3*3,超出的部分保留数据
            self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)
            self.conv2d = Conv2d(in_channels=3,out_channels=3,kernel_size=3,stride=1,padding=0)
    
        def forward(self,input):
            output = self.conv2d(input)
            output = self.maxpool(output)
            return output
    
    # 实例化对象
    Work = ConNet()
    
    # CIFAR10数据使用
    dataset = torchvision.datasets.CIFAR10("./datasetvision",train=False,download=False,transform=torchvision.transforms.ToTensor())
    
    # 数据加载
    dataloader = DataLoader(dataset,batch_size=64)
    
    writer = SummaryWriter("logs_MaxPoolAndConv2d")
    
    step = 0
    for data in dataloader:
        imgs,target = data
        writer.add_images("input",imgs,step)
        output = Work(imgs)
        writer.add_images("output",output,step)
        step = step + 1
    
    writer.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40

    结果:
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    基于hough变换的多个重叠圆检测matlab仿真
    c++ builder 6.0 使用TADOQuery ,TADOCommand,TADOConnection
    《DevOps 精要:业务视角》- 读书笔记(一)
    Pretrained 预训练模型的加载与使用,为什么可以把不相关的模型用过来?
    如何实现云上 Lakehouse 高性能
    花菁染料CY5.5标记角叉藻胶;CY5.5-Furcellaran;Furcellaran-CY5.5定制合成
    【计算机网络】Web服务器的配置
    ABAP 报表中如何给报表的输入参数增添 F4 Value Help
    Redis实现API访问频率限制
    c++ fstream 文件追加模式
  • 原文地址:https://blog.csdn.net/qq_44864833/article/details/125513812