深度学习在图像处理中的应用学习笔记

深度学习在图像处理中的应用学习笔记
这篇学习笔记用于记录本人在读研期间的学习内容
在刚入学不久，发现一个B站up主对这方面进行了一系列的整理+总结，并上传了代码，并且非常成体系
因此本人打算跟着这位up主的步骤，对这方面进行学习并且做一个记录，同时也会写下自己一些心得，后续也会不断的更新博客内容，打算这里放链接，编辑的内容放在博客园。
在此放上up主的链接(点我)以及GitHub链接

大致内容分为图像分类，目标检测，语义分割，实例分割以及关键点检测几个内容

 所需环境

这篇所涉及的项目都使用Pytorch完成
- Anaconda3（建议使用）
- python=3.6/3.7/3.8
- pycharm (IDE)
- pytorch=1.11.0 (pip package)
- torchvision=0.12.0 (pip package)
- cudatoolkit=11.3(pip下载pytorch时)
```
conda install pytorch==1.11.0 torchvision=0.12.0 cudatoolkit=11.3 -c pytorch `
1
```
插一块验证pytorch是否安装好的代码
```
import torch
a = torch.cuda.is_available()
print(a)
ngpu= 1
device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")
print(device)
print(torch.cuda.get_device_name(0))
print(torch.rand(3,3).cuda())
1
2
3
4
5
6
7
8
```
运行后的结果

 图像分类

图像分类都采用5类花的分类

 LeNet

1998年
论文：《Gradient-Based Learning Applied to Document Recognition》
应用：PyTorch复现LeNet-5学习笔记

 AlexNet

2012年
论文：《ImageNet Classification with Deep Convolutional Neural Networks》
应用：PyTorch复现AlexNet学习笔记

 VGG

2015年
论文：《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》
应用：PyTorch复现VGG学习笔记

 GoogLeNet

inception-v1

2015年
论文：《Going Deeper with Convolutions》
应用：PyTorch复现GoogleNet学习笔记
inception-v2
2015年
论文：《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》
应用：以后补上
inception-v3
2015年
论文：《Rethinking the Inception Architecture for Computer Vision》
应用：
inception-v4
2016年
论文：《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》
应用:

ResNet

2015年
论文：《Deep Residual Learning for Image Recognition》
应用：PyTorch复现ResNet学习笔记

注意：之后这篇博客只用来记录完成的进度，学习笔记就先不写了

ResNeXt

2017 IEEE.CVPR
论文：《Aggregated Residual Transformations for Deep Neural Networks》
应用：PyTorch复现ResNeXt √
--------------------------------------2023.1.2(到目前完成的)----------------------------------------

MobilNet

v1

2017.4.17
论文：《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision
Applications》

v2

2018 IEEE.CVPR
论文:《MobileNetV2: Inverted Residuals and Linear Bottleneck》
应用：PyTorch复现MobilNet_v2√

v3

2019.11.20
论文:《Searching for MobileNetV3》
应用：PyTorch复现MobilNet_v3√

ShuffleNet

v1

2017.12.7
论文:《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile
Devices》

v2

2018.7.30
论文:《ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design》
应用：PyTorch复现ShuffleNet_v2√

Transfomer

2017.12.6
论文:《Attention Is All You Nee》

EfficientNet

v1

2019.9.11 CVPR
论文：《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》
应用：PyTorch复现EfficientNet_v1√

v2

2021.6.23 2021.CVPR
论文：《EfficientNetV2: Smaller Models and Faster Training》
应用：PyTorch复现EfficientNet_v2√

RepVGG

2021.5.29 CVPR
论文：《RepVGG: Making VGG-style ConvNets Great Again》
应用：PyTorch复现RepVGG√

Vsion Transformer

2021.6.3 ICLR
论文：《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》
应用：PyTorch复现Vsion Transformer√

Swin Transformer

2021.8.17 ICCV
论文：《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》
应用：PyTorch复现Swin Transformer√

ConvNeXt

2022.5.2 CVPR
论文：《A ConvNet for the 2020s》
应用：PyTorch复现ConvNeXt√

--------------------------------------2023.3.15(到目前完成的----------------------------------------

MobileViT

2022.ICLR
论文：《MOBILEVIT: LIGHT-WEIGHT, GENERAL-PURPOSE,AND MOBILE-FRIENDLY VISION TRANSFORMER》
应用：PyTorch复现MobileViT √

目标检测

数据集:
训练集：PASCALVOC-2012train(5717)
测试集：PASCALVOC-2012val(5823)

R-CNN

2014.CVPR
论文：《Rich feature hierarchies for accurate object detection and semantic segmentation》

Fast R-CNN

2015.ICCV
论文：《Fast R-CNN》

Faster R-CNN

2016.CVPR
论文：《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》
复现：resnet50-fpn,换backbone √

FPN

2017.IEEE
论文：《Feature Pyramid Networks for Object Detection》
复现：应用于Faster R-CNN √

--------------------------------------2023.4.20(到目前完成的)----------------------------------------

SSD

2016 ECCV
论文：《SSD: Single Shot MultiBox Detector》
复现：resnet50为backbone√

RetiNet

2017 CVPR
论文：《Focal Loss for Dense Object Detection》
复现：PyTorch复现RetiNet √

Fcos

2019 CVPR
论文：《FCOS: A Simple and Strong Anchor-free Object Detector》
复现：PyTorch复现Fcos √

YOLO系列

 v1

2016 CVPR
论文：《You Only Look Once:Unified, Real-Time Object Detection》

v2

2017 CVPR
论文：《YOLO9000:Better, Faster, Stronger》

v3

2018 CVPR
论文：《YOLOv3: An Incremental Improvement》
复现：yolov3-spp√

v4

2020 CVPR
论文：《YOLOv4: Optimal Speed and Accuracy of Object Detection》
复现：yolov4√

v5

论文：无论文
复现：yolov5√
--------------------------------------2023.6.9(到目前完成的)----------------------------------------

X

2021 CVPR
论文：《YOLOX: Exceeding YOLO Series in 2021》
复现：yolovx√

v6

2022.9.7 CVPR
论文：《YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications》
复现：yolov6(mmyolo框架)√

v7

2022.7.6 CVPR
论文：《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors》
复现：yolov7√

v8

2023.1.10 代码开源
论文：无
复现：yolov8(mmyolo)√

YOLO综述

2023.6.12 CVPR
论文：《A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 AND BEYOND》
--------------------------------------2023.7.10(到目前完成的)----------------------------------------
相关阅读:
2021蓝桥杯真题小蓝卡片数学+二分查找+前缀和优化
 OrcaTerm AI
缺少比较器，运放来救场！（运放当做比较器电路记录）
基于nacos netflix loadbalancer灰度发布策略
 kafka Consumer分析与速度特性
 c++中的宏#define用途
 QT CmakeLists配置python
DO-178C Standard
HK32F030MF4P6 SWD管脚功能复用GPIO
重磅！OpenAI发布GPT-4o，非常惊艳语音版ChatGPT！
原文地址：https://blog.csdn.net/kushe123/article/details/127912367

所需环境

图像分类

LeNet

AlexNet

VGG

GoogLeNet

inception-v1

ResNet

ResNeXt

MobilNet

v1

v2

v3

ShuffleNet

v1

v2

Transfomer

EfficientNet

v1

v2

RepVGG

Vsion Transformer

Swin Transformer

ConvNeXt

MobileViT

目标检测

R-CNN

Fast R-CNN

Faster R-CNN

FPN

SSD

RetiNet

Fcos

YOLO系列

v1

v2

v3

v4

v5

X

v6

v7

v8

YOLO综述