采集数据
标注数据
加载数据
预处理数据
创建模型
训练——优化模型参数
保存模型及参数
加载模型及参数
预测
以图像处理为例,获取需要的图像数据,将它们缩放成需要的分辨率,分辨率大小和所创建的模型有关。
在有监督的机器学习中,一般会对图片做以下处理:
如果是检测,需要标记检测物在图片中的坐标、大小;
如果是分类,将不同类别的图片放入不同的文件夹中。
PyTorch 提供特定领域的库,例如:处理文本数据处理库TorchText、 图像数据处理库TorchVision和音频波形处理库TorchAudio。所有这些库都包含数据集,例如TorchVision中的datasets可以下载 CIFAR、COCO、FashionMNIST 等数据集。
我们以FashionMNIST为例。
Fashion-MNIST:替代MNIST手写数字集的图像数据集,该数据集由衣服、鞋子等服饰组成,包含70000张图像,其中60000张训练图像加10000张测试图像,图像大小为28x28,单通道,共分10个类,如下图