参见论文:何凯明:Deep Residual Learning for Image Recognition
使用的库:
torchvision:处理图像数据,包含一些数据集,模型,转换函数,独立于pytorch,需要独立安装,主要由以下四部分组成(1)torchvision.models:提供深度学习中经典的网络结构(Alex-net,ResNet,VGG,Inception)
(2)torchvision.datasets:提供常用的数据集
(3)torchvision.transforme:常用的数据预处理操作
(4)torchvision.utils:工具类
实现目标:每张图片对应一个label,能够让模型识别图片对应的model(图像分类任务)
阅读深度学习代码技巧:得搞清楚数据集的格式是什么,即数据集的输入是什么,输出是什么。(通过Debug来调试解读,更加方便快捷)
输入:图片变成向量,