• 利用PaddleDetection 训练自定义VOC数据集进行目标检测


    1.环境配置

    操作系统 Windows
    python 3.8
    paddlepaddle-gpu 2.3.0
    CUDA 10.2
    cuDNN 7.6.5
    ppdet 2.2.4

    2.项目结构

     3.准备数据集

    1、下载源码后,打开项目,在PaddleDetection/dataset目录下新建文件夹 mydata

    2、在PaddleDetection/dataset/mydata目录下新建文件夹Annotations、JPEGImages 

     3、将所有所有标注的XML文件放到dataset/mydata/Annotations目录下 如下图

     4、将所有标注的图片放到dataset/mydata/JPEGImages目录下,如下图

    5.利用 create_data_list.py 来生成对应的文本文件

     4.修改指定配置文件

    本项目中,使用YOLOv3模型里的 configs/yolov3/yolov3_mobilenet_v1_270e_voc.yml 训练
    从上图看到yolov3_mobilenet_v1_270e_voc.yml 配置需要依赖其他的配置文件。该例子依赖:

    在修改文件之前,先给大家解释一下各依赖文件的作用:

    ①‘ …/datasets/voc.yml’主要说明了训练数据和验证数据的路径,包括数据格式(coco、voc等)
    ②‘…/runtime.yml’,主要说明了公共的运行状态,比如说是否使用GPU、迭代轮数等等
    ③‘_base/optimizer_270e.yml’,主要说明了学习率和优化器的配置,以及设置epochs。在其他的训练的配置中,学习率和优化器是放在了一个新的配置文件中。 ‘base/yolov3_mobilenet_v1.yml’,主要说明模型、和主干网络的情况说明.。。。
    ④‘_base/yolov3_reader.yml’, 主要说明了读取后的预处理操作,比如resize、数据增强等等。

    请保证PaddleDetection环境配置好之后按照如下图示修改即可:

    voc.yml

     runtime.yml

    optimizer_270e.yml 和 yolov3_mobilenet_v1.yml 无需进行修改,默认即可!

    yolov3_reader.yml

     4.开始训练

    PaddleDetection提供了单卡/多卡训练模式,满足用户多种训练需求

    (1)单卡训练

    1. export CUDA_VISIBLE_DEVICES=0 #windows和Mac下不需要执行该命令
    2. python tools/train.py -c configs/yolov3/yolov3_mobilenet_v1_270e_voc.yml
    3. python tools/train.py -c configs/yolov3_mobilenet_v1_270e_voc.yml --eval

    首先指定CUDA的环境变量
    其中 -c 后边代表指定配置文件的路径 

    (2)多卡训练

    1. export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 #windows和Mac下不需要执行该命令
    2. python -m paddle.distributed.launch --gpus 0,1,2,3,4,5,6,7 tools/train.py -c configs/yolov3/yolov3_darknet53_270e_voc.yml

    (3)训练过程图示

    create_data_list:

    1. import os
    2. import random
    3. import xml.etree.ElementTree
    4. from tqdm import tqdm
    5. # 打乱数据
    6. def shuffle_data(data_list_path):
    7. with open(data_list_path, 'r', encoding='utf-8') as f:
    8. lines = f.readlines()
    9. random.shuffle(lines)
    10. with open(data_list_path, 'w', encoding='utf-8') as f:
    11. f.writelines(lines)
    12. # 生成图像列表
    13. def create(images_dir, annotations_dir, train_list_path, test_list_path, label_file):
    14. f_train = open(train_list_path, 'w', encoding='utf-8')
    15. f_test = open(test_list_path, 'w', encoding='utf-8')
    16. f_label = open(label_file, 'w', encoding='utf-8')
    17. label = set()
    18. images = os.listdir(images_dir)
    19. i = 0
    20. for image in tqdm(images):
    21. i += 1
    22. annotation_path = os.path.join(annotations_dir, image[:-3] + 'xml').replace('\\', '/')
    23. image_path = os.path.join(images_dir, image).replace('\\', '/')
    24. if not os.path.exists(annotation_path):
    25. continue
    26. root = xml.etree.ElementTree.parse(annotation_path).getroot()
    27. for object in root.findall('object'):
    28. label.add(object.find('name').text)
    29. if i % 20 == 0:
    30. f_test.write("%s %s\n" % (image_path[image_path.find('/') + 1:], annotation_path[annotation_path.find('/') + 1:]))
    31. else:
    32. f_train.write("%s %s\n" % (image_path[image_path.find('/') + 1:], annotation_path[annotation_path.find('/') + 1:]))
    33. for l in label:
    34. f_label.write("%s\n" % l)
    35. f_train.close()
    36. f_test.close()
    37. f_label.close()
    38. # 打乱训练数据
    39. shuffle_data(train_list_path)
    40. print('create data list done!')
    41. if __name__ == '__main__':
    42. create('./JPEGImages', './Annotations', './trainval.txt', './test.txt', './label_list.txt')

  • 相关阅读:
    CMS之promotion failed&concurrent mode failure
    MM32F0020 UART1中断接收
    【python】Django——templates模板、静态文件、django模板语法、请求和响应
    5--Linux:文件
    Mybatis 拦截器(Mybatis插件原理)
    【27. 表达式求值(中缀表达式)】
    PDF文件格式(二):交叉引用类型“O“
    一套完善的设备管理系统能给企业带来什么?
    JVM—对象的创建
    [LeetCode周赛复盘] 第 81 场双周赛20220625
  • 原文地址:https://blog.csdn.net/weixin_50016546/article/details/126469095