MaxPool2d详解--在数组和图像中的应用

1、环境要求

1、需要安装Pytorch依赖
2、官方文档conv2d
3、图片需要CIFAR10数据集

2、原理讲解

用卷积核覆盖在原始数据上，选择原始数据中被卷积核覆盖的最大值

在这里插入图片描述
选择卷积核覆盖时的最大值，ceil_mode控制卷积核超出原始数据后是否进行保留

3、函数要求

函数：
在这里插入图片描述
参数要求

kernel_size设置卷积核大小的属性
stride和conv2d中的stride一样，是控制移动步幅的属性，这里注意，conv2d默认值是1，但是MaxPool2d默认值是卷积核大小
padding设置原始数据周围填充的属性
dilation:表明给原始数据之间添加0的属性
ceil_mode控制当卷积核超过原始图像时，是否对max进行保留

4、例子

4.1、数组

代码：

import torch
import torchvision

from torch.nn import Module,MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]],dtype=torch.float32)

print("前",input.shape)      # torch.Size([5, 5])，不满足输入的条件，需要进行格式转换

input = torch.reshape(input,(-1,1,5,5))

print("后",input.shape)    # 后 torch.Size([1, 1, 5, 5]) 一个bach_size，

class ConNet(Module):
    def __init__(self):
        super(ConNet, self).__init__()
        # 池化层使用，设置卷积核为3*3,超出的部分保留数据
        self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)

    def forward(self,input):
        output = self.maxpool(input)
        return output

# 实例化对象
Work = ConNet()

# 神经网络调用
output = Work(input)
print(output)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

结果：
在这里插入图片描述

4.2、图像

代码：


import torch
import torchvision

from torch.nn import Module,MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

class ConNet(Module):
    def __init__(self):
        super(ConNet, self).__init__()
        # 池化层使用，设置卷积核为3*3,超出的部分保留数据
        self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)

    def forward(self,input):
        output = self.maxpool(input)
        return output

# 实例化对象
Work = ConNet()

# CIFAR10数据使用
dataset = torchvision.datasets.CIFAR10("./datasetvision",train=False,download=False,transform=torchvision.transforms.ToTensor())

# 数据加载
dataloader = DataLoader(dataset,batch_size=64)

writer = SummaryWriter("logs_MaxPool")

step = 0
for data in dataloader:
    imgs,target = data
    writer.add_images("input",imgs,step)
    output = Work(imgs)
    writer.add_images("output",output,step)
    step = step + 1

writer.close()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

结果：
在这里插入图片描述

4.3、Conv2d+MaxPool2d图像

代码：


import torch
import torchvision

from torch.nn import Module,MaxPool2d,Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

class ConNet(Module):
    def __init__(self):
        super(ConNet, self).__init__()
        # 池化层使用，设置卷积核为3*3,超出的部分保留数据
        self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)
        self.conv2d = Conv2d(in_channels=3,out_channels=3,kernel_size=3,stride=1,padding=0)

    def forward(self,input):
        output = self.conv2d(input)
        output = self.maxpool(output)
        return output

# 实例化对象
Work = ConNet()

# CIFAR10数据使用
dataset = torchvision.datasets.CIFAR10("./datasetvision",train=False,download=False,transform=torchvision.transforms.ToTensor())

# 数据加载
dataloader = DataLoader(dataset,batch_size=64)

writer = SummaryWriter("logs_MaxPoolAndConv2d")

step = 0
for data in dataloader:
    imgs,target = data
    writer.add_images("input",imgs,step)
    output = Work(imgs)
    writer.add_images("output",output,step)
    step = step + 1

writer.close()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

结果：
在这里插入图片描述

相关阅读:
基于hough变换的多个重叠圆检测matlab仿真
c++ builder 6.0 使用TADOQuery ，TADOCommand,TADOConnection
《DevOps 精要:业务视角》- 读书笔记（一）
Pretrained 预训练模型的加载与使用，为什么可以把不相关的模型用过来？
如何实现云上 Lakehouse 高性能
花菁染料CY5.5标记角叉藻胶；CY5.5-Furcellaran；Furcellaran-CY5.5定制合成
【计算机网络】Web服务器的配置
ABAP 报表中如何给报表的输入参数增添 F4 Value Help
Redis实现API访问频率限制
c++ fstream 文件追加模式

原文地址：https://blog.csdn.net/qq_44864833/article/details/125513812