• 猿创征文|OpenCV编程——计算机视觉的登堂入室


    计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄像头和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步做图像处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。

    图像和视频再当今的数字世界可谓无处不在,随着运算能力强劲而又实惠的计算设备的问世,创建复杂的图像应用从未像今天这般容易。市面上有众多的软件和库用于操作图像和视频,但是对于期望自己开发软件的人而言,OpenCV库是一款必备的工具。OpenCV(Open Source Computer Vision)是一个开放源代码的图像及视频分析库,它包含500多个优化过的算法。自1999年问世以来,它已经被计算机视觉领域的学者和开发人员视为首选工具。下面就一起进入计算机视觉的大门!

    一、接触图像

    本章将带领你完成最基本的操作:读取、显示及保存图像。在着手开发前需要先安装库和一个顺手的IDE,这里推荐VS或者Qt。计算机视觉不依赖于特定的环境或操作系统。

    • opencv_core模块:包含核心功能,尤其是底层数据结构和算法函数。
    • opencv_imgproc模块:包含图像处理函数。
    • opencv_highgui模块:包含读写图像及视频的函数,以及操作图形用户界面函数。
    • opencv_features2d模块:包含兴趣点检测子、描述子以及兴趣点匹配框架。

    下面开始读取我们准备的图像,然后设置窗口,接着在窗口中显示图像,不停等待用户键入退出:

    cv::Mat image = cv::imread("/home/dzh/QtOpenCV/image.png", 1);
    cv::namedWindow("Image");
    cv::imshow("Image", image);
    cv::waitKey(0);
    
    • 1
    • 2
    • 3
    • 4

    下面我是在写的一个图像查看类,主要功能是读取文件夹中所有图像并依次显示出来。

    在这里插入图片描述

    二、操作像素

    为了编写计算机视觉应用,你必须会存取图像的内容,如修改和创建图像。本章会教会你如何操作图像的基本像素,即所谓的像素。你将学会如何遍历一张图像并且处理其像素。opencv采用cv::Mat这个数据结构来表示图像是因为矩阵的每个元素代表一个像素。对于灰度图像而言,像素由8位无符号数来表示,其中0代表黑色,255代表白色;对于彩色图像则需要3个颜色通道的24位无符号数表示。

    我们可以使用指针遍历图像,遍历图像的领域操作,进行简单的图像运算,定义感兴趣区域。

    // 颜色缩减[指针遍历]
    void MainWindow::colorReduce(cv::Mat &image, cv::Mat &result, int div) {
        // 行数
        int nl = image.rows;
        // 每行的元素个数(像素个数 x 通道数)
        int nc = image.cols * image.channels();
        // 左移位数
        int n = 0;
        // 遍历每一行
        for (int j = 0; j < nl; j++) {
            // 得到第j行的首地址
            uchar* data = image.ptr<uchar>(j);
            // 求解pow的反函数
            for (int k = 1; k <= 8; k++) {
                if (pow(2, k) == div) {
                    n = k;
                    break;
                } else if (pow(2, k) > div) {
                    n = k - 1;
                    break;
                }
            }
            // 掩码左移
            uchar mask = 0xFF << n;
            for (int i = 0; i < nc; i++) {
    //            data[i] = data[i] / div * div + div / 2;
                data[i] = (data[i] & mask) + div / 2;
            }
        }
    }
    
    // 图像运算
    void MainWindow::imageProc(cv::Mat &image1, cv::Mat &image2, cv::Mat &result) {
        result = image1 * 0.8 + image2 * 0.2;
    }
    
    // 感兴趣区域
    void MainWindow::imageROI(cv::Mat &image1, cv::Mat &image2) {
        // 相当于截取图像的一个区域
        cv::Mat roi = image1(cv::Rect(280, 260, image2.cols, image2.rows));
        cv::addWeighted(roi, 0.2, image2, 0.8, 0.1, roi);
    
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43

    三、基于类的图像处理

    计算机视觉程序的质量与良好的编程习惯紧密相关。创建不含BUG的应用仅仅是开始,我们希望应用能够轻松应付新的需求。设计模式是软件工程中众所周知的概念。一个设计模式是一个可靠的、可重用的方案,用于解决软件设计中频繁出现的问题。首先是策略模式,使用控制器实现模块间通信,使用单件设计模式,使用MVC架构设计应用程序。

    void Histogram1D::process() {
        cv::Mat image = cv::imread("/home/dzh/QtOpenCV/image.png");
        if (!image.data) {
            cout << "图像不存在" << endl;
            return;
        } else {
            cout << "图像的宽度:" << image.cols << "图像的高度:" << image.rows << "像素总数:" << image.cols * image.rows << endl;
        }
        Histogram1D hc;
        cv::Mat imageROI; // 获取感兴趣区域
        imageROI = image(cv::Rect(160, 300, 100, 120));
        int minSat = 65;  // 彩色直方图
        cv::MatND colorhist = hc.getHueHistogram(imageROI, minSat);
        ContentFinder finder;
        finder.setHistogram(colorhist);
        cv::Mat detect = cv::imread("/home/dzh/QtOpenCV/image.png");
        cv::imshow("Detect", detect);
        cv::Mat hsv;
        cv::cvtColor(image, hsv, CV_BGR2HSV);
        vector<cv::Mat> v;
        cv::split(hsv, v);
        cv::Mat result;
        cv::threshold(v[1], v[1], minSat, 255, cv::THRESH_BINARY);
        result = finder.find(hsv, 0.0f, 180.0f, channels, 1);
        cv::bitwise_and(result, v[1], result);
        cv::Rect rect(110, 260, 35, 40);
        cv::rectangle(image, rect, cv::Scalar(255, 255, 255));
        cv::TermCriteria criteria(cv::TermCriteria::MAX_ITER, 10, 0.01);
        cv::meanShift(result, rect, criteria);
    //    cv::imshow("origin", colorhist);
        cv::imshow("output", result);
        cv::waitKey(0);
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33

    颜色空间转换效果图:

    在这里插入图片描述

    四、使用直方图统计像素

    一个图像是由不同颜色值的像素组成的。像素值在图像中的分布情况是这幅图像的一个重要特征。可以计算并使用直方图来修改图像的外观。对于灰度图像,直方图相当于长度为256的数组,每个数组元素代表灰度值为当前下标的像素个数。

    cv::Mat Histogram3D::getHistogramImage(cv::Mat &image) {
        // 先求取直方图(256x256x256)
        cv::MatND hist = getHistogram(image);
        // 设置最大值和最小值
        double maxVal = INT_MIN;
        double minVal = INT_MAX;
        // 创建显示图像256x256x3
        cv::Mat histImg(histSize[0], histSize[0], CV_8UC3, cv::Scalar(255, 255, 255));
        int hpt = static_cast<int>(0.9 * histSize[0]);
        // 3D->2D,可以减少一个维度
        vector<vector<float>> vec(3, vector<float>(256));
        // b通道
        for (int i = 0; i < 256; i++) {
            // g通道
            for (int j = 0; j < 256; j++) {
                // r通道
                for (int k = 0; k < 256; k++) {
                    vec[0][i] += hist.at<float>(i, j, k);
                    vec[1][j] += hist.at<float>(i, j, k);
                    vec[2][k] += hist.at<float>(i, j, k);
                }
            }
        }
        // 先遍历每一行
        for (int i = 0; i < vec.size(); i++) {
            // 对于每一行直方图取最大值和最小值
            cv::minMaxLoc(vec[i], &minVal, &maxVal, 0, 0);
            cout << "maxVal:" << maxVal <<",minVal:" << minVal << endl;
            // 再遍历每一列
            for (int j = 0; j < vec[i].size(); j++) {
                float val = vec[i][j];
                int intensity = static_cast<int>(val * hpt / maxVal);
                cv::Scalar color;
                color[i] = 255;
                cv::line(histImg, cv::Point(j, histSize[i]), cv::Point(j, histSize[i] - intensity), color);
            }
        }
        return histImg;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39

    即使是最常用的640x480的图像,也有30万个像素,可想平时看视频时候的1080P和4K,那每秒都是30帧以上,每帧都几百万像素。

    在这里插入图片描述

    五、基于形态学运算的图像变换

    形态学滤波理论于上世纪90年代提出,被用于分析及处理离散图形。它定义了一系列运算,应用预定义的形状元素来变换一张图像。形状元素与像素相邻点相交的方式确定了运算结果。腐蚀和膨胀就是最基本的形态学运算。由于形态学滤波通常使用于二值图像,使用白色像素表示前景物体,使用黑色像素表示背景。开闭运算都是最基本的,这里我们演示下使用形态学滤波对图像进行边缘及角点检测。

    cv::Mat MorphoFeatures::getEdges(cv::Mat &image) {
        // 得到梯度图
        cv::Mat result;
        cv::morphologyEx(image, result, cv::MORPH_GRADIENT, cv::Mat());
        // 阈值化得到二值图像
        applyThreshold(result);
        return result;
    }
    
    void MorphoFeatures::setThreshold(int value) {
        threshold = value;
    }
    
    cv::Mat MorphoFeatures::getCorners(cv::Mat &image) {
        cv::Mat result;
        cv::dilate(image, result, cross);
        cv::erode(result, result, diamond);
    
        cv::Mat result2;
        cv::dilate(image, result2, x);
        cv::erode(result2, result, square);
    
        cv::absdiff(result2, result, result);
        applyThreshold(result);
        return result;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    使用自带函数可以轻松检测直线,角点需要定义4种结构元素:方形、菱形、十字形和X形。
    在这里插入图片描述

    可以使用分水岭算法对图像进行分割,还可以使用GrabCut算法提取前景物体。

    六、图像滤波

    滤波(Filtering)是信号处理及图像处理中的一个基本操作,旨在特定的应用程序中,选择性地提取图像中被认为传达重要信息的部分。滤波去除图像中的噪声,提取感兴趣的视觉特征,允许图像重采样。矩阵位于中心的元素对应的是滤波器当前正在处理的像素。这样的矩阵称为核(Kernel)或者掩码(Mask)。最常用的有:均值滤波、中值滤波、Sobel滤波和图像的拉普拉斯变换。

    cv::Mat contoursInv;
    cv::threshold(contours, contoursInv, 128, 255, cv::THRESH_BINARY_INV);
    cv::imshow("Inv", contoursInv);
    cv::Mat result1, result2;
    cv::Sobel(image, result1, CV_8U, 1, 0, 3, 0.4, 128);
    cv::Sobel(image, result2, CV_8U, 0, 1, 3, 0.4, 128);
    cv::imshow("result1", result1);
    cv::imshow("result2", result2);
    cv::Mat sobelX, sobelY;
    cv::Sobel(image, sobelX, CV_8U, 1, 0);
    cv::Sobel(image, sobelY, CV_8U, 0, 1);
    cv::Mat sobel;
    sobel = sobelX + sobelY;
    cv::imshow("Sobel", sobel);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    下面从左上是原图,然后依次是均值滤波、中值滤波和sobel滤波后的结果,均值滤波一般都都会模糊图像,中值滤波去除噪声点非常有效,sobel算子广泛用于边缘或轮廓的检测。

    在这里插入图片描述

    七、检测并匹配特征点

    在计算机视觉中兴趣点(也叫做关键点或特征点)的概念被大量用于解决物体识别、图像匹配、视觉跟踪和三维重建等问题。cv::cornerHarris检测Harris角点,当然Fast角点检测要更加快速。这里介绍下尺度不变的概念,它是指每个检测到的特征点都伴随着对应的尺寸因子,其中非常受欢迎的特征点:SURF特征点,它也是SIFT算法的高效变种。

    在特征匹配中,特征描述子通常是N维向量,在光照以及少许透视变换的情况下很理想。检测特征点可以概述为:提取关键点,计算描述子。

    // 计算Harris角点
    void HarrisDetector::detect(cv::Mat &image) {
        cv::cornerHarris(image, cornerStrength, neighbourhood, aperture, k);
        double minStrength;
        cv::minMaxLoc(cornerStrength, &minStrength, &maxStregth);
        cv::Mat dilated;
        cv::dilate(cornerStrength, dilated, cv::Mat());
        cv::compare(cornerStrength, dilated, localMax, cv::CMP_EQ);
    }
    
    // 由Harris值获取角点图
    cv::Mat HarrisDetector::getCornerMap(double qualityLevel) {
        cv::Mat cornerMap;
        threshold = qualityLevel * maxStregth;
        cv::threshold(cornerStrength, cornerTh, threshold, 255, cv::THRESH_BINARY);
        cornerTh.convertTo(cornerMap, CV_8U);
        cv::bitwise_and(cornerMap, localMax, cornerMap);
        return cornerMap;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    当然以上特征点检测库函数并不在OpenCV中,由于专利原因被全部安排到扩展库中了。安装方法可以参考我的教程:ubuntu安装opencv_contrib扩展库,附踩坑+测试

    在这里插入图片描述

    当然计算机视觉是一个非常庞大的学科,本文限于篇幅只能讲解一二,感兴趣的同学可以再去读相关的书籍。现在CV主要任务是目标识别、目标检测和目标跟踪,网络结构也从传统的CNN变为了Transformer,人工智能的快速发展离不开CV,也离不开大家开源的贡献!

  • 相关阅读:
    HTML——5.表单、框架、颜色
    红黑树的概念
    node.js医院预约挂号系统的设计与实现毕业设计源码141041
    为什么Facebook运营需使用IP代理?有哪些美国IP代理好用?
    使用EasyExcel实现CSV文件读写功能,顺手使用Idea创建SpringBoot工程集成swagger3
    【汉诺塔】问题,详细解析,手把手教会你
    如何真正“不花一分钱”部署一个属于你的大模型
    壳聚糖-聚乙二醇-叠氮,叠氮-PEG-壳聚糖,Chitosan-PEG-N3
    力扣795.区间子数组个数 | 树状数组解法
    HTML介绍——HTML筑基
  • 原文地址:https://blog.csdn.net/qq_42257666/article/details/126650323