• torchvision详细介绍


    前言

    深度学习的道路漫漫,唯有不断总结,脚踏实地才能造就一番阵地,也不断的勉励自己,不要放弃,相信自己可以哒。

    torchvision详细介绍

    t o r c h v i s i o n torchvision torchvision p y t o r c h pytorch pytorch的一个图形库,它服务于PyTorch深度学习框架的,主要用来构建计算机视觉模型。以下是torchvision的构成:
    (图形库,构建计算机是视觉模型)

    • torchvision.datasets: 一些加载数据的函数及常用的数据集接口
    • torchvision.models: 包含常用的模型结构,(含预测训练模型),例如:AlexNet、VGG、ResNet
    • torchvision.transforms:常用的图片变换、例如裁剪、旋转等。
    • torchvision.utils:其他一些有用的方法。

    torchvision.transforms

    • torchvision.transforms: 主要用于常见的一些图形变换
    • torchvision.transforms.Compose()类:这个类的主要作用是传串联多个图片变换的操作,这个类的构造很简单。
    # 图像预处理步骤
    transform = transforms.Compose([
        transforms.Resize(96), # 缩放到 96 * 96 大小
        transforms.ToTensor(), # 转化为Tensor
        transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
    ])
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    torchvision.datasets

    用来进行数据加载的,pytorch团队在这个包中帮我们提前处理了好多图片数据集

    MNISTCOCO
    Captions
    Detection
    LSUN
    ImageFolder
    Imagenet-12
    CIFAR
    STL10
    SVHN
    PhotoTour

    # Image processing
    img_transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.5,), (0.5,)),
    ])
    # MNIST dataset
    mnist = datasets.MNIST(
        root='./data/', train=True, transform=img_transform, download=True)
    # Data loader
    dataloader = torch.utils.data.DataLoader(
        dataset=mnist, batch_size=batch_size, shuffle=True)
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    torchvision.models

    • torchvision.models 中为我们提供了已经训练好的模型,让我们可以加载之后,直接使用。
    • torchvision.models:模块的子模块包含以下模型结构

    AlexNet
    VGG
    ResNet
    SqueezeNet
    DenseNet

    import torchvision.models as models
    resnet18 = models.resnet18()
    alexnet = models.alexnet()
    squeezenet = models.squeezenet1_0()
    densenet = models.densenet_161()
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    也可以使用pretrained = True来加载一个别人预训练好的model。

    import torchvision.models as models
    resnet18 = models.resnet18(pretrained=True)
    alexnet = models.alexnet(pretrained=True)
    
    
    • 1
    • 2
    • 3
    • 4

    整体效果

    # 我们这里还是对MNIST进行处理,初始的MNIST是 28 * 28,我们把它处理成 96 * 96 的torch.Tensor的格式
    from torchvision import transforms as transforms
    import torchvision
    from torch.utils.data import DataLoader
     
    # 图像预处理步骤
    transform = transforms.Compose([
        transforms.Resize(96), # 缩放到 96 * 96 大小
        transforms.ToTensor(),
        transforms.Normalize((0.5), (0.5)) # 归一化
    ])
     
    DOWNLOAD = True
    BATCH_SIZE = 32
     
    train_dataset = torchvision.datasets.MNIST(root='./data/', train=True, transform=transform, download=DOWNLOAD)
     
     
    train_loader = DataLoader(dataset=train_dataset,
                              batch_size=BATCH_SIZE,
                              shuffle=True)
     
    print(len(train_dataset))
    print(len(train_loader))
    
    
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
  • 相关阅读:
    2022暑期训练题单(基本算法)Day1~2
    【听课笔记】复旦大学遗传学_03基因
    JVM(十二) —— 对象的实例化
    如何选择最适合 Android 的 SD 卡恢复软件?
    python调用seafile接口上传文件到seafile
    别太小看“静态免杀“
    门控时钟介绍
    计算机操作系统(持续学习中)
    js通过数组内容来获取数组下标
    【Git】git 分支或指定文件回退到指定版本
  • 原文地址:https://blog.csdn.net/kuxingseng123/article/details/128194960