• 【pytorch笔记】第七篇 最大池化层和非线性激活


    一、池化层

    1.1 池化层原理

    ① 最大池化层有时也被称为下采样

    dilation为空洞卷积,如下图所示。

    ③ Ceil_model为当超出区域时,只取最左上角的值。

    ④ 池化使得数据由5 * 5 变为3 * 3,甚至1 * 1的,这样导致计算的参数会大大减小。例如1080P的电影经过池化的转为720P的电影、或360P的电影后,同样的网速下,视频更为不卡。
    在这里插入图片描述

    1.2 池化层处理数据

    import torch
    from torch import nn 
    from torch.nn import MaxPool2d
    
    input = torch.tensor([[1,2,0,3,1],
                         [0,1,2,3,1],
                         [1,2,1,0,0],
                         [5,2,3,1,1],
                         [2,1,0,1,1]], dtype = torch.float32)
    input = torch.reshape(input,(-1,1,5,5)) 
    print(input.shape)
    
    class MyModule(nn.Module):
        def __init__(self):
            super(MyModule, self).__init__()
            self.maxpool = MaxPool2d(kernel_size=3, ceil_mode=True)
            
        def forward(self, input):
            output = self.maxpool(input)
            return output
            
    myModule= MyModule()
    output =myModule(input)
    print(output)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    torch.Size([1, 1, 5, 5])
    tensor([[[[2., 3.],
              [5., 1.]]]])
    
    • 1
    • 2
    • 3

    1.3 池化层处理图片

    import torch
    import torchvision
    from torch import nn 
    from torch.nn import MaxPool2d
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    dataset = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       
    dataloader = DataLoader(dataset, batch_size=64)
    
    class MyModule(nn.Module):
        def __init__(self):
            super(MyModule, self).__init__()
            self.maxpool = MaxPool2d(kernel_size=3, ceil_mode=True)
            
        def forward(self, input):
            output = self.maxpool(input)
            return output
    
    myModule = MyModule()
    writer = SummaryWriter("logs")
    step = 0
    
    for data in dataloader:
        imgs, targets = data
        writer.add_images("input", imgs, step)
        output = tudui(imgs)
        writer.add_images("output", output, step)
        step = step + 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    Files already downloaded and verified
    
    • 1

    在 Anaconda 终端里面,激活py3.6.3环境,再输入 tensorboard --logdir=C:\Users\qj\CV\logs 命令,将网址赋值浏览器的网址栏,回车,即可查看tensorboard显示日志情况。
    在这里插入图片描述
    此处不再贴图,打开显示的连接查看即可。

    2. 非线性激活

    inplace为原地替换,若为True,则变量的值被替换。若为False,则会创建一个新变量,将函数处理后的值赋值给新变量,原始变量的值没有修改。

    import torch
    from torch import nn
    from torch.nn import ReLU
    
    input = torch.tensor([[1,-0.5],
                          [-1,3]])
    input = torch.reshape(input,(-1,1,2,2))
    print(input.shape)
    
    class MyModule(nn.Module):
        def __init__(self):
            super(MyModule, self).__init__()
            self.relu1 = ReLU()
            
        def forward(self, input):
            output = self.relu1(input)
            return output
        
    myModule= MyModule()
    output = myModule(input)
    print(output)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    torch.Size([1, 1, 2, 2])
    tensor([[[[1., 0.],
              [0., 3.]]]])
    
    • 1
    • 2
    • 3

    2.1 Tensorboard显示

    import torch
    import torchvision
    from torch import nn 
    from torch.nn import ReLU
    from torch.nn import Sigmoid
    from torch.utils.data import DataLoader
    from torch.utils.tensorboard import SummaryWriter
    
    dataset = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       
    dataloader = DataLoader(dataset, batch_size=64)
    
    class MyModule(nn.Module):
        def __init__(self):
            super(MyModule, self).__init__()
            self.relu1 = ReLU()
            self.sigmoid1 = Sigmoid()
            
        def forward(self, input):
            output = self.sigmoid1(input)
            return output
    
    myModule= MyModule()
    writer = SummaryWriter("logs")
    step = 0
    
    for data in dataloader:
        imgs, targets = data
        writer.add_images("input", imgs, step)
        output = myModule(imgs)
        writer.add_images("output", output, step)
        step = step + 1
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31

    在 Anaconda 终端里面,激活py3.6.3环境,再输入 tensorboard --logdir=C:\Users\qj\CV\logs 命令,将网址赋值浏览器的网址栏,回车,即可查看tensorboard显示日志情况。此处不再贴图,打开显示的连接查看即可。

  • 相关阅读:
    Win 10: vscode latex环境配置
    高能预警!第十七届 D2 第一波话题新鲜出炉 ~
    Spring Security登录流程分析
    java-net-php-python-ssm公司人力资源管理系统计算机毕业设计程序
    Arduino UNO + DS1302简单获取时间并串口打印
    hdlbits系列verilog解答(always块nolatch语句)-36
    C++中关于多线程并发访问实例函数与静态函数
    Arduino程序设计(十一)8×8 共阳极LED点阵显示(74HC595)
    24、D-NeRF: Neural Radiance Fields for Dynamic Scenes
    3 基于采样的路径规划 —— RRT算法
  • 原文地址:https://blog.csdn.net/qq_35793394/article/details/127849125