执行如下命令安装数据集制作工具labelimg
pip install labelimg
执行命令labelimg,运行数据集制作工具
labelimg工具界面如下:
点击Open Dir按钮,打开待制作的图片文件(尽量将图片放置在images目录下,方便后面分割数据集)
点击左侧的模式切换按钮,将数据模式从PascalVOC切换到YOLO模式
绘制box框,并指明标签
点击createBox按钮,绘制矩形边框,并设置标签文本(无口罩)。
点击Save按钮,保存样本标签信息(尽量将标签文件放置在labels文件夹下,方便后面进行数据分割)
点击Next Image按钮,对下一幅图像进行处理(有口罩)
之后点击save按钮,保存样本标签信息(标签信息尽量保存在labels文件夹下)
逐一图片进行处理,即可完成数据集制作
如果不想制作数据集,可以下载口罩数据集(点击下载,密码:sv74),并将数据集解压到项目根目录下(mask为数据集目录)。
下载数据集分割代码(点击下载),将其放在mask目录下,执行data_split.py,将数据集分割成训练数据集和验证数据集。分割后,数据集目录结构如下:
可以调整data_split.py中的TRAIN_RATIO = 80,来指明训练数据集和验证数据比例。
复制data目录下的coco.yaml,另存为mask.yaml,并修改其内容。修改后内容如下:
train: ./mask/train.txt
val: ./mask/val.txt
nc: 2
names: [ 'no-mask', 'mask' ]
下载预训练模型(点击下载),将其放置在项目根目录中。
复制一份train.py,并重命名为train_mask.py.
打开train_mask.py,修改如下几项配置:
parser.add_argument(‘–weights’, type=str, default=‘yolov7_training.pt’, help=‘initial weights path’)
parser.add_argument(‘–data’, type=str, default=‘data/mask.yaml’, help=‘data.yaml path’)
parser.add_argument(‘–epochs’, type=int, default=100)
parser.add_argument(‘–project’, default=‘runs/train/mask’, help=‘save to project/name’)
parser.add_argument(‘–batch-size’, type=int, default=2, help=‘total batch size for all GPUs’)
运行train_mask.py,进行模型训练。大概到20轮左右,模型识别精度能达到95%以上。
runs\train\mask\exp11\weights\best.pt即为最佳模型参数。
可以将best.pt拷贝到项目根目录中,并重命名为yolov7_mask.pt,方便之后使用.
复制测试代码文件test.py,并重命名为test_mask.py
修改模型参数文件
parser.add_argument(‘–weights’, nargs=‘+’, type=str, default=‘yolov7_mask.pt’, help=‘model.pt path(s)’)
修改数据集路径
parser.add_argument(‘–data’, type=str, default=‘data/mask.yaml’, help=‘*.data path’)
修改测试项目名称
parser.add_argument(‘–project’, default=‘runs/test/mask’, help=‘save to project/name’)
运行代码test_mask.py,运行日志如下:
运行结果如下(在runs/test/mask/exp目录下):
如果pip install 安装软件时,提示FileNotFoundError: [Errno 2] No such file or directory错误,需要执行以下命令更新pip和安装工具。
pip install --upgrade setuptools
python -m pip install --upgrade pip
如果出现错误:ModuleNotFoundError: No module named ‘tensorboard’,则执行pip install tensorboard安装该类库即可。
如果出现内存不足,调整batch-size即可,调整方法详见3.2节。