• opencv(11):训练自己的opencv级联分类器


    一 采集数据并制作正负样本数据集

    1.1 录制视频

     1.2 将单个视频截取为指定分辨率的图像

    1.3 处理负样本视频

    1.4 本次训练正负样本数量选择与图片重编号

    二 利用matlab制作制作正样本标注框文件

    三 开始训练opencv级联分类器

    3.1 生成正样本文件pos.txt

    3.1.1 对label.txt进行处理,

    3.1.2 生成暂时性的pos.txt即pos_tmp.txt

    3.1.3 合并pos_tmp.txt和label.txt,得到pos.txt

    3.1.4 手动将pos.txt中小数改为整数

    3.2 生成负样本文件neg.txt 

     3.3 生成样本文件

     四 测试级联分类器及调参

    4.1 pub_image功能包

    4.2 利用级联分类器检测车辆

    4.3 编译运行

    4.4 github仓


    @meng

    一 采集数据并制作正负样本数据集

    1.1 录制视频

            录制的视频如下,包括正样本视频(车辆)、负样本视频(不包含车辆)。

            利用自己手机或者相机等录制视频有一个好处是—原始的图像分辨率一致(视频的分辨率均为1920*1080),比从网上或一些数据集上找的数据要好一些(可能数据量不够全面,但简单学习应该是够用)

    1.2 将单个视频截取为指定分辨率的图像

            这里选择导出为分辨率640*360(原始分辨率1920*1080各缩小3倍)

            用PotPlayer视频软件打开一个视频;将视频暂停,并将时间拖到视频开头

    依次点击:PotPlayer—视频—图像截取—连续截图

    这里根据需要配置如下,注意箭头所指的地方,自己熟悉后可以根据需要进行更改;配置完成后,点击“开始”此页面不要关闭!!!!!!!!

     

    直接点击播放,即可在指定的路径下生成当前视频的指定分辨率的图片

    对其他正样本视频进行类似处理就好;总共得到293个正样本图片 

    1.3 处理负样本视频

            为了保证负样本是正样本的3倍-5倍,需要截取比正样本多的图片,这里截取了1357个负样本图片

            (这里就不放图了)

    1.4 本次训练正负样本数量选择与图片重编号

            注:图像重编号不是必要的,但是重编号后能够保证后面matlab生成的标注框顺序与图片顺序在各种排序(win10、ubuntu)下能够比较容易保持一致

            从选择100张,负样本中选择300张;分别重新编号为pos-00001。。。pos-00100,放到pos文件夹下,neg-00001。。。neg-00300,放到neg文件夹下        

            这里提供一种方法:使用ubuntu系统进行的重编号:图片目录下,依次全选、右键重命名、输入pos_00或输入neg_00,点击+号并选择”001,002,003,004

    二 利用matlab制作制作正样本标注框文件

            打开matlab,依次APP--图像处理和计算机视觉--Image Labeler;会弹出Image Labeler窗口,效果如下:

    Image Labeler窗口内,点击Load—Add image from folder,到达正样本文件夹时,CTRL+A选中全部图片即可,如下:

    创建car标签

    创建car标签后,会自动选中car标签(如果创建多个标签,需要先选中指定标签);然后将鼠标在图片中框选出car区域,即可完成一张图片的标注

    标注完所有图片后,选择导出到文件;

    同时也选择导出到工作空间

    查看导出到工作空间的变量内容: 

    依次查看左边上下上下两个箭头所指的源图片目录和标签内容,可以看出导入到image labeler的图片是按照名称序号排序的;说明得到的标注框(下图右图)也是按照图片名称顺序排序的

     将标签内容另存为一个txt文件,取名为label.txt

    三 开始训练opencv级联分类器

            注:下面使用ubuntu系统进行操作,win10下面操作是类似的

            下面这张图片是这节最终得到的文件目录,下面操作中有不清楚的可以看这张图片

    3.1 生成正样本文件pos.txt

            将文件夹名称分别取为pos(车辆),neg(非车辆)--前面改了这里就不用改了,并将两个文件夹里面非图片内容删除;将matlab生成的标签文件label.txt拿到外边来

    3.1.1 对label.txt进行处理,

    修改前如下:

     用空格代替“,”

    1. #在当前目录,打开终端,输入:
    2. sed -i 's/,/ /g' label.txt

    去除每行的第一个字符:

    sed -i 's/^.//' label.txt

    去除右方框号

    sed -i 's/]//' label.txt  

    修改后结果如下:

    3.1.2 生成暂时性的pos.txt即pos_tmp.txt

    1. #在当前目录下,打开终端,输入:
    2. ls pos/*.*>pos_tmp.txt

    在每行末尾加上“ 1 ”(空格1空格)

    sed -i 's/$/ 1 /g' pos_tmp.txt

     

    3.1.3 合并pos_tmp.txt和label.txt,得到pos.txt

    运行逐行合并脚本:

    python imerge2oneline.py

    imerge2oneline.py:

    1. # -*- coding:UTF-8 -*-
    2. '''
    3. https://zhidao.baidu.com/question/437546324704569644.html
    4. 先将两个文件分别读取到两个列表中,再用循环输出到第3个文件。
    5. '''
    6. f_ = open('pos_tmp.txt','r')
    7. n=0
    8. list1=[]
    9. for i in f_.readlines():
    10. n+=1
    11. s=i.strip()
    12. list1.append(s)
    13. f_.close()
    14. print list1
    15. ff_ = open('label.txt','r')
    16. m=0
    17. list2=[]
    18. for i in ff_.readlines():
    19. m+=1
    20. s=i.strip()
    21. list2.append(s)
    22. ff_.close()
    23. print list2
    24. fff_=open('pos.txt','w')
    25. for i in range(n):
    26. s=list1[i]+' '+list2[i]
    27. fff_.write(s+'\n')
    28. print(s)
    29. fff_.close()

    3.1.4 手动将pos.txt中小数改为整数

    修改原则为尽可能接近标注框或者略微大于标注框;这里修改得有些随意。。。

    改前:

    改后:

    3.2 生成负样本文件neg.txt 

    ls neg/*.*>neg.txt

     3.3 生成样本文件

            将opencv目录下的可执行文件复制到当前目录来:

                    opencv_createsamples文件

                    opencv_traincascade文件

    (注:对应win10为opencv_createsamples.exe文件、opencv_traincascade.exe文件;  ubuntu系统如果安装了opencv,可以在计算机根目录“/”或者opencv源码编译目录下面搜索文件名,即可找到,复制到当前目录即可;这里opencv2.4.13、opencv3.2测试过,opencv4.x应该也可以执行下面的操作)

           生成样本文件:

    (正样本的分辨率为640*360,这里观察多张正样本图片中车辆大小,大概是1/3的长和宽,这里640/3余不尽,还没有测试1/4,这里选择了1/5)

    ./opencv_createsamples -vec pos.vec -info pos.txt -bg neg.txt -w 128 -h 72
    1. meng@meng:~/ivrc/opencv_adaboost/mooc0525$ ./opencv_createsamples -vec pos.vec -info pos.txt -bg neg.txt -w 128 -h 72
    2. Info file name: pos.txt
    3. Img file name: (NULL)
    4. Vec file name: pos.vec
    5. BG file name: neg.txt
    6. Num: 1000
    7. BG color: 0
    8. BG threshold: 80
    9. Invert: FALSE
    10. Max intensity deviation: 40
    11. Max x angle: 1.1
    12. Max y angle: 1.1
    13. Max z angle: 0.5
    14. Show samples: FALSE
    15. Width: 128
    16. Height: 72
    17. Max Scale: -1
    18. Create training samples from images collection...
    19. pos.txt(101) : parse errorDone. Created 100 samples

    创建data文件夹

    训练得到级联分类器文件

    opencv_traincascade -data data -vec pos.vec -bg neg.txt -numPos 100 -numNeg 300 -numStages 10 -featureType LBP -w 128 -h 72 -minHitRate 0.995 -maxFalseAlarmRate 0.3

     训练得到的级联分类器文件如下:

     四 测试级联分类器及调参

            下面使用两个功能包进行测试,一个是将图片发布为话题,另一个是利用级联分类器进行检测

    4.1 pub_image功能包

             主要代码如下:/camera_ws/src/pub_image/src/imwrite_1.cpp

    1. #include <ros/ros.h>
    2. #include <opencv2/opencv.hpp>
    3. #include "opencv2/highgui.hpp"
    4. #include "opencv2/core.hpp"
    5. #include "opencv2/imgproc.hpp"
    6. #include <image_transport/image_transport.h> //C++标准输入输出库
    7. #include <opencv2/highgui/highgui.hpp> //opencv2标准头文件
    8. #include <cv_bridge/cv_bridge.h> //cv_bridge中包含CvBridge库
    9. #include <iostream>
    10. using namespace std;
    11. int main(int argc, char** argv)
    12. {
    13. ros::init(argc, argv, "image_publisher");
    14. ros::NodeHandle nh;
    15. image_transport::ImageTransport it(nh);
    16. image_transport::Publisher pub = it.advertise("/usb_cam/image_raw", 1);
    17. cv::Mat srcImage;
    18. //加载图像
    19. srcImage = cv::imread("/home/meng/ivrc/opencv_adaboost/camera_ws/src/pub_image/src/pos_030.png",1);
    20. //std::cout << " rows " <<"\t"<<srcImage.rows << std::endl;
    21. //std::cout << " cols " <<"\t"<<srcImage.cols << std::endl;
    22. if (srcImage.empty())
    23. {
    24. std::cout << "load image fail!" << std::endl;
    25. return -1;
    26. }
    27. sensor_msgs::ImagePtr msg = cv_bridge::CvImage(std_msgs::Header(), "bgr8", srcImage).toImageMsg();
    28. ros::Rate loop_rate(5);
    29. while (nh.ok()) {
    30. pub.publish(msg);
    31. ros::spinOnce();
    32. loop_rate.sleep();
    33. }
    34. //cv::namedWindow("src window", CV_WINDOW_NORMAL);
    35. //cv::imshow("src window", srcImage);
    36. //保存图像到当前项目
    37. //cv::imwrite("save.jpg", srcImage);
    38. //cv::namedWindow("save window", CV_WINDOW_NORMAL);
    39. //cv::imshow("save window", srcImage);
    40. //cv::waitKey(0);
    41. //销毁所有窗口
    42. //cv::destroyAllWindows();
    43. return 0;
    44. }

    4.2 利用级联分类器检测车辆

    主要文件为:/camera_ws/src/opencv_detect/scripts/book_detect.py

    1. #!/usr/bin/env python
    2. # -*- coding:utf-8 -*-
    3. import rospy
    4. import cv2
    5. # from std_msgs.msg import String
    6. from sensor_msgs.msg import Image
    7. from cv_bridge import CvBridge
    8. def callback(imgmsg):
    9. bridge=CvBridge()
    10. img=bridge.imgmsg_to_cv2(imgmsg,"bgr8")
    11. cv2.namedWindow("callback",cv2.WINDOW_NORMAL)
    12. cv2.imshow("callback",img)
    13. detect_book(img)
    14. cv2.waitKey(10)
    15. def detect_book(img_detect):
    16. cascade_tidy=cv2.CascadeClassifier("/home/meng/ivrc/opencv_adaboost/mooc0525/data/cascade.xml")
    17. cv2.namedWindow("camera",cv2.WINDOW_NORMAL)
    18. gray=cv2.cvtColor(img_detect,cv2.COLOR_BGR2GRAY)
    19. tidys=cascade_tidy.detectMultiScale(gray,1.25, 50) #这两个参数“1.25、50”可以调整
    20. # 参数3:scaleFactor–表示在前后两次相继的扫描中,搜索窗口的比例系数。默认为1.1即每次搜索窗口依次扩大10%;
    21. # 参数4:minNeighbors–表示构成检测目标的相邻矩形的最小个数(默认为3个)。
    22. for (x,y,w,h) in tidys:
    23. cv2.rectangle(img_detect,(x,y),(x+w,y+h),(0,255,0),2)
    24. cv2.imshow("camera",img_detect)
    25. cv2.waitKey(10)
    26. def listener():
    27. rospy.init_node('book_detect',anonymous=True)
    28. rospy.Subscriber('/usb_cam/image_raw',Image,callback)
    29. rospy.spin()
    30. if __name__=='__main__':
    31. listener()

    4.3 编译运行

    开启roscore:

    roscore
    

    另开一个终端:

    1. catkin_make
    2. source devel/setup.bash
    3. rosrun pub_image pub_image_node

    再另开一个终端:

    1. source devel/setup.bash
    2. rosrun opencv_detect book_detect.py

     检测效果如下:

    4.4 github仓

            自己发的第一个github,欢迎学习交流

    GitHub - menghxz/opencv-cascade-classifier-test

  • 相关阅读:
    整数——算法专项刷题(一)
    光电探测器怎么选
    还在用微信截图吗?这2个免费软件你不能错过
    【动手学深度学习PyTorch版】10 PyTorch 神经网络基础
    沉睡者 - 现在的百度渠道还有网赚时机吗?
    Ubuntu安装Android Studio
    统信桌面操作系统PXE单机部署
    Hive CLI和Beeline命令行的基本使用
    MyBatis的缓存
    微信小程序毕业设计开题报告_springboot音乐网站
  • 原文地址:https://blog.csdn.net/BIT_HXZ/article/details/124992751