• yolo5 训练无人人机识别系统


    环境搭建:

    安装驱动

    点击鼠标右键,如果出现NVIDIA图标,点开,出现如下图片

     我的显卡是1650,根据显卡的型号去官网找相应的驱动下载就好了。驱动官网

    安装好之后,打开命令行cmd,输入如下指令:

    nvidia-smi

    显示出如下数据即为安装成功。 

     安装anaconda

    进入官网,下载windows版本,将程序放在c盘以外,防止c盘爆红,接下来傻瓜式点击安装即可。

    安装Pytorch

    打开侧边栏,找到anaconda文件夹下面的prompt控制台

    可以使用如下命令去看系统有哪些环境

    conda env list

     我的环境是这样的

    其中pytorch1是我之前安装的环境,这里我们新创建一个环境pytorch,创建过程中一直输入y就好了。

    conda create -n pytorch python=3.8

     激活这个环境:

    conda activate pytorch
    

     为了提高安装速度,给环境换源:

    1. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    2. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    3. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
    4. conda config --set show_channel_urls yes

    可以去官网看看最新的安装指令,我这个指令是n年前的,官网:PyTorch

    安装pytorch,我的显卡支持11.6的版本,你们可以查自己的显卡支持的版本

    conda install pytorch torchvision torchaudio pytorch-cuda=11.6

    数据集准备:

    使用labelimg标注数据集,将数据集按照这样的目录结构存放

    20210831173834541.png

    Annotations里面存放着xml格式的标签文件

    JPEGImages里面存放着照片数据文件

    数据集划分代码如下,放在VOCdevkit同一级目录下就可以运行。

    classes = ["plane"]是因为数据集标注时的我打的标签是plane,所以要识别一下。

    1. import xml.etree.ElementTree as ET
    2. import pickle
    3. import os
    4. from os import listdir, getcwd
    5. from os.path import join
    6. import random
    7. from shutil import copyfile
    8. classes = ["plane"]
    9. # classes=["ball"]
    10. TRAIN_RATIO = 80
    11. def clear_hidden_files(path):
    12. dir_list = os.listdir(path)
    13. for i in dir_list:
    14. abspath = os.path.join(os.path.abspath(path), i)
    15. if os.path.isfile(abspath):
    16. if i.startswith("._"):
    17. os.remove(abspath)
    18. else:
    19. clear_hidden_files(abspath)
    20. def convert(size, box):
    21. dw = 1. / size[0]
    22. dh = 1. / size[1]
    23. x = (box[0] + box[1]) / 2.0
    24. y = (box[2] + box[3]) / 2.0
    25. w = box[1] - box[0]
    26. h = box[3] - box[2]
    27. x = x * dw
    28. w = w * dw
    29. y = y * dh
    30. h = h * dh
    31. return (x, y, w, h)
    32. def convert_annotation(image_id):
    33. in_file = open('VOCdevkit/VOC2007/Annotations/%s.xml' % image_id)
    34. out_file = open('VOCdevkit/VOC2007/YOLOLabels/%s.txt' % image_id, 'w')
    35. tree = ET.parse(in_file)
    36. root = tree.getroot()
    37. size = root.find('size')
    38. w = int(size.find('width').text)
    39. h = int(size.find('height').text)
    40. for obj in root.iter('object'):
    41. difficult = obj.find('difficult').text
    42. cls = obj.find('name').text
    43. if cls not in classes or int(difficult) == 1:
    44. continue
    45. cls_id = classes.index(cls)
    46. xmlbox = obj.find('bndbox')
    47. b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
    48. float(xmlbox.find('ymax').text))
    49. bb = convert((w, h), b)
    50. out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
    51. in_file.close()
    52. out_file.close()
    53. wd = os.getcwd()
    54. wd = os.getcwd()
    55. data_base_dir = os.path.join(wd, "VOCdevkit/")
    56. if not os.path.isdir(data_base_dir):
    57. os.mkdir(data_base_dir)
    58. work_sapce_dir = os.path.join(data_base_dir, "VOC2007/")
    59. if not os.path.isdir(work_sapce_dir):
    60. os.mkdir(work_sapce_dir)
    61. annotation_dir = os.path.join(work_sapce_dir, "Annotations/")
    62. if not os.path.isdir(annotation_dir):
    63. os.mkdir(annotation_dir)
    64. clear_hidden_files(annotation_dir)
    65. image_dir = os.path.join(work_sapce_dir, "JPEGImages/")
    66. if not os.path.isdir(image_dir):
    67. os.mkdir(image_dir)
    68. clear_hidden_files(image_dir)
    69. yolo_labels_dir = os.path.join(work_sapce_dir, "YOLOLabels/")
    70. if not os.path.isdir(yolo_labels_dir):
    71. os.mkdir(yolo_labels_dir)
    72. clear_hidden_files(yolo_labels_dir)
    73. yolov5_images_dir = os.path.join(data_base_dir, "images/")
    74. if not os.path.isdir(yolov5_images_dir):
    75. os.mkdir(yolov5_images_dir)
    76. clear_hidden_files(yolov5_images_dir)
    77. yolov5_labels_dir = os.path.join(data_base_dir, "labels/")
    78. if not os.path.isdir(yolov5_labels_dir):
    79. os.mkdir(yolov5_labels_dir)
    80. clear_hidden_files(yolov5_labels_dir)
    81. yolov5_images_train_dir = os.path.join(yolov5_images_dir, "train/")
    82. if not os.path.isdir(yolov5_images_train_dir):
    83. os.mkdir(yolov5_images_train_dir)
    84. clear_hidden_files(yolov5_images_train_dir)
    85. yolov5_images_test_dir = os.path.join(yolov5_images_dir, "val/")
    86. if not os.path.isdir(yolov5_images_test_dir):
    87. os.mkdir(yolov5_images_test_dir)
    88. clear_hidden_files(yolov5_images_test_dir)
    89. yolov5_labels_train_dir = os.path.join(yolov5_labels_dir, "train/")
    90. if not os.path.isdir(yolov5_labels_train_dir):
    91. os.mkdir(yolov5_labels_train_dir)
    92. clear_hidden_files(yolov5_labels_train_dir)
    93. yolov5_labels_test_dir = os.path.join(yolov5_labels_dir, "val/")
    94. if not os.path.isdir(yolov5_labels_test_dir):
    95. os.mkdir(yolov5_labels_test_dir)
    96. clear_hidden_files(yolov5_labels_test_dir)
    97. train_file = open(os.path.join(wd, "yolov5_train.txt"), 'w')
    98. test_file = open(os.path.join(wd, "yolov5_val.txt"), 'w')
    99. train_file.close()
    100. test_file.close()
    101. train_file = open(os.path.join(wd, "yolov5_train.txt"), 'a')
    102. test_file = open(os.path.join(wd, "yolov5_val.txt"), 'a')
    103. list_imgs = os.listdir(image_dir) # list image files
    104. prob = random.randint(1, 100)
    105. print("Probability: %d" % prob)
    106. for i in range(0, len(list_imgs)):
    107. path = os.path.join(image_dir, list_imgs[i])
    108. if os.path.isfile(path):
    109. image_path = image_dir + list_imgs[i]
    110. voc_path = list_imgs[i]
    111. (nameWithoutExtention, extention) = os.path.splitext(os.path.basename(image_path))
    112. (voc_nameWithoutExtention, voc_extention) = os.path.splitext(os.path.basename(voc_path))
    113. annotation_name = nameWithoutExtention + '.xml'
    114. annotation_path = os.path.join(annotation_dir, annotation_name)
    115. label_name = nameWithoutExtention + '.txt'
    116. label_path = os.path.join(yolo_labels_dir, label_name)
    117. prob = random.randint(1, 100)
    118. print("Probability: %d" % prob)
    119. if (prob < TRAIN_RATIO): # train dataset
    120. if os.path.exists(annotation_path):
    121. train_file.write(image_path + '\n')
    122. convert_annotation(nameWithoutExtention) # convert label
    123. copyfile(image_path, yolov5_images_train_dir + voc_path)
    124. copyfile(label_path, yolov5_labels_train_dir + label_name)
    125. else: # test dataset
    126. if os.path.exists(annotation_path):
    127. test_file.write(image_path + '\n')
    128. convert_annotation(nameWithoutExtention) # convert label
    129. copyfile(image_path, yolov5_images_test_dir + voc_path)
    130. copyfile(label_path, yolov5_labels_test_dir + label_name)
    131. train_file.close()
    132. test_file.close()

     运行后多生成了两个文件夹,如下:

     至此,我们就得到了想要的数据集

    训练模型

    下载yolo5源码:

    地址

    导入数据

    将VOCdevkit文件夹放入目录

     安装环境依赖:

    pip install -r requirements.txt

    确定训练权重

    yolov5的5.0版本给我们提供了几个预训练权重,我们可以对应我们不同的需求选择不同的版本的预训练权重。预训练权重可以通过这个网址进行下载,本次训练自己的数据集用的预训练权重为yolov5s.pt。

    修改参数

    预训练模型和数据集都准备好了,就可以开始训练自己的yolov5目标检测模型了,训练目标检测模型需要修改两个yaml文件中的参数。一个是data目录下的相应的yaml文件,一个是model目录文件下的相应的yaml文件。

    一:

     修改data目录下的相应的yaml文件。找到目录下的voc.yaml文件,将该文件复制一份,将复制的文件重命名,最好和项目相关。我这里修改为plane.yaml。该项目是对无人机的识别。

    里面的内容改成这样:

    1. # PASCAL VOC dataset http://host.robots.ox.ac.uk/pascal/VOC/
    2. # Train command: python train.py --data voc.yaml
    3. # Default dataset location is next to /yolov5:
    4. # /parent_folder
    5. # /VOC
    6. # /yolov5
    7. # download command/URL (optional)
    8. #download: bash data/scripts/get_voc.sh
    9. # train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
    10. train: VOCdevkit/images/train # 16551 images
    11. val: VOCdevkit/images/val # 4952 images
    12. # number of classes
    13. nc: 1
    14. # class names
    15. names: [ 'plane']

    二:

     修改models目录下的相应的yaml文件。找到目录下的yolov5s.yaml文件,将该文件复制一份,将复制的文件重命名。我这里修改为yolov5s_plane.yaml。

    将这里的识别对象改为1即可:

     然后找到train.py文件,改这三个地方,改成我们刚才下载和修改的文件

    1. parser.add_argument('--weights', type=str, default='weights/yolov5x.pt', help='initial weights path')
    2. parser.add_argument('--cfg', type=str, default='models/yolov5s_plane.yaml', help='model.yaml path')
    3. parser.add_argument('--data', type=str, default='data/plane.yaml', help='data.yaml path')

    以上我们把参数就都配置好了,运行的话可能会提示我们虚拟内存不够,这时我们需要修改这个地方。

     把这个参数改成0

     然后就可以开始训练了,训练结束后会生成一个run文件夹

    应用模型:

    找到run文件夹下面的best.pt文件,他通常在train文件夹下面的最后一个exp下面。

    打开detect.py文件,修改这一出为我们训练好的文件

     这个地方设置为0,就是调用电脑摄像头

     我们这里在手机上下载一款应用,DroidCam,与电脑连接统一局域网,移动端显示如下:

     我们修改detect.py中的配置

     这样就连上了手机摄像头

    连接数据库

    我们先引入数据库的用户名,密码等配置

    1. import pymysql
    2. id = 5
    3. def insert_sql():
    4. # 建立连接
    5. conn = pymysql.connect(
    6. host="localhost",
    7. # host="192.168.1.112",
    8. user="root", # 用户名
    9. passwd="password111", # 用户密码
    10. db="检测小车") # 数据库名
    11. global id
    12. # 创建游标,默认是元组型
    13. cursor = conn.cursor()
    14. # sql = "select * from t_plane"#数据库中表的名
    15. sql = '''INSERT INTO t_plane(id,x,y) VALUES(num,7,2);''' # 数据库中表的名
    16. sql = sql.replace("num", str(id))
    17. cursor.execute(sql)
    18. conn.commit()
    19. id += 1
    20. cursor.close()
    21. conn.close()

    id为5,是因为我的数据id设置为自增的,现在有四条,所以id就暂时设置成5。

    在程序中检测到物品都会给予一个评分,我们设置判断条件,但评分>0.9时,向数据库插入数据,意味着发现了目标

  • 相关阅读:
    八股文(Web篇——网络通讯部分)第十二天
    AOP(面向切面编程)
    Kafka学习笔记(二)
    全波形反演的深度学习方法: 第二章 正演 (草稿)
    Java之泛型系列--构造方法使用泛型(有示例)
    Docker 部署mysql8(arm64)
    搭建一个windows的DevOps环境记录
    who命令
    扬州大学2022年858程序设计与数据结构试题参考答案
    数据库:常用数据库的创建
  • 原文地址:https://blog.csdn.net/qq_51118755/article/details/127919611