B站UP主“我是土堆”视频内容
torchvision简介
torchvision是pytorch的一个图形库,它服务于PyTorch深度学习框架的,主要用来构建计算机视觉模型。以下是torchvision的构成:
torchvision.datasets: 一些加载数据的函数及常用的数据集接口;
torchvision.models: 包含常用的模型结构(含预训练模型),例如AlexNet、VGG、ResNet等;
torchvision.transforms: 常用的图片变换,例如裁剪、旋转等;
torchvision.utils: 其他的一些有用的方法。
torchvision.transforms
torchvision.transforms主要是用于常见的一些图形变换。
torchvision.transforms.Compose()类。这个类的主要作用是串联多个图片变换的操作。这个类的构造很简单:
# 图像预处理步骤
transform = transforms.Compose([
transforms.Resize(96), # 缩放到 96 * 96 大小
transforms.ToTensor(), # 转化为Tensor
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
])
torchvision.datasets
torchvision.datasets 是用来进行数据加载的,PyTorch团队在这个包中帮我们提前处理好了很多很多图片数据集,有以下的一些数据集:
MNISTCOCO
Captions
Detection
LSUN
ImageFolder
Imagenet-12
CIFAR
STL10
SVHN
PhotoTour
…
- # Image processing
- img_transform = transforms.Compose([
- transforms.ToTensor(),
- transforms.Normalize((0.5,), (0.5,)),
- ])
- # MNIST dataset
- mnist = datasets.MNIST(
- root='./data/', train=True, transform=img_transform, download=True)
- # Data loader
- dataloader = torch.utils.data.DataLoader(
- dataset=mnist, batch_size=batch_size, shuffle=True)
torchvision.models 中为我们提供了已经训练好的模型,让我们可以加载之后,直接使用。
torchvision.models模块的子模块中包含以下模型结构。
AlexNet
VGG
ResNet
SqueezeNet
DenseNet
…
- import torchvision.models as models
- resnet18 = models.resnet18()
- alexnet = models.alexnet()
- squeezenet = models.squeezenet1_0()
- densenet = models.densenet_161()
也可以通过使用 pretrained=True 来加载一个别人预训练好的模型
- import torchvision.models as models
- resnet18 = models.resnet18(pretrained=True)
- alexnet = models.alexnet(pretrained=True)
下面是B站UP主“我是土堆”视频内容
下面的pytorch的官方文档

cifar10的数据集介绍如下

使用torchvision下载需要的数据集程序界面如下
测试集第一个数据的输出如下,最后的数字3表示类别,3对应猫


加入transforms,把图片数据转换成tensor数据

如果数据集下载比较慢可以用迅雷下载,数据集的下载地址可以通过以下步骤去查找
按住ctrl,点击cifar10

复制url到迅雷当中去下载

程序如下:
- import torchvision
- from torch.utils.tensorboard import SummaryWriter
-
- dataset_transform = torchvision.transforms.Compose([
- torchvision.transforms.ToTensor()
- ])
-
- train_set = torchvision.datasets.CIFAR10(root="./dataset_CIFAR10",train=True,transform=dataset_transform,download=True)
- test_set = torchvision.datasets.CIFAR10(root="./dataset_CIFAR10",train=False,transform=dataset_transform,download=True)
-
- # print(test_set[0])
- # print(test_set.classes)
- # img,target = test_set[0]
- # print(img)
- # print(target)
- # print(test_set.classes[target])
- # img.show()
-
- # print(test_set[0])
- writer = SummaryWriter("p10")
- for i in range(10):
- img,target = test_set[i]
- writer.add_image("test_set",img,i)
-
- writer.close()
参考文献: