torchvision详细介绍

前言

深度学习的道路漫漫，唯有不断总结，脚踏实地才能造就一番阵地，也不断的勉励自己，不要放弃，相信自己可以哒。

torchvision详细介绍

$t o r c h v i s i o n$ 是 $p y t o r c h$ 的一个图形库，它服务于PyTorch深度学习框架的，主要用来构建计算机视觉模型。以下是torchvision的构成：
(图形库，构建计算机是视觉模型）

torchvision.datasets: 一些加载数据的函数及常用的数据集接口。
torchvision.models: 包含常用的模型结构，（含预测训练模型），例如：AlexNet、VGG、ResNet等
torchvision.transforms：常用的图片变换、例如裁剪、旋转等。
torchvision.utils：其他一些有用的方法。

torchvision.transforms

torchvision.transforms: 主要用于常见的一些图形变换。
torchvision.transforms.Compose()类：这个类的主要作用是传串联多个图片变换的操作，这个类的构造很简单。

# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(), # 转化为Tensor
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # 归一化
])

1
2
3
4
5
6
7

torchvision.datasets

用来进行数据加载的，pytorch团队在这个包中帮我们提前处理了好多图片数据集。

MNISTCOCO
Captions
Detection
LSUN
ImageFolder
Imagenet-12
CIFAR
STL10
SVHN
PhotoTour

# Image processing
img_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,)),
])
# MNIST dataset
mnist = datasets.MNIST(
    root='./data/', train=True, transform=img_transform, download=True)
# Data loader
dataloader = torch.utils.data.DataLoader(
    dataset=mnist, batch_size=batch_size, shuffle=True)

1
2
3
4
5
6
7
8
9
10
11
12

torchvision.models

torchvision.models 中为我们提供了已经训练好的模型，让我们可以加载之后，直接使用。
torchvision.models:模块的子模块包含以下模型结构。

AlexNet
VGG
ResNet
SqueezeNet
DenseNet

import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
squeezenet = models.squeezenet1_0()
densenet = models.densenet_161()

1
2
3
4
5
6

也可以使用pretrained = True来加载一个别人预训练好的model。

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)

1
2
3
4

整体效果

# 我们这里还是对MNIST进行处理，初始的MNIST是 28 * 28，我们把它处理成 96 * 96 的torch.Tensor的格式
from torchvision import transforms as transforms
import torchvision
from torch.utils.data import DataLoader
 
# 图像预处理步骤
transform = transforms.Compose([
    transforms.Resize(96), # 缩放到 96 * 96 大小
    transforms.ToTensor(),
    transforms.Normalize((0.5), (0.5)) # 归一化
])
 
DOWNLOAD = True
BATCH_SIZE = 32
 
train_dataset = torchvision.datasets.MNIST(root='./data/', train=True, transform=transform, download=DOWNLOAD)
 
 
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=BATCH_SIZE,
                          shuffle=True)
 
print(len(train_dataset))
print(len(train_loader))



1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

相关阅读:
2022暑期训练题单（基本算法）Day1~2
【听课笔记】复旦大学遗传学_03基因
JVM(十二) —— 对象的实例化
如何选择最适合 Android 的 SD 卡恢复软件？
python调用seafile接口上传文件到seafile
别太小看“静态免杀“
门控时钟介绍
计算机操作系统（持续学习中）
js通过数组内容来获取数组下标
【Git】git 分支或指定文件回退到指定版本

原文地址：https://blog.csdn.net/kuxingseng123/article/details/128194960