• 山东大学数字图像处理实验(二)


    前言

    • 本次为《对比度和亮度调整》与《背景相减两个实验》
    • 源码地址在文末

    对比度和亮度调整实验

    实验过程中遇到和解决的问题

    • 问题一

      • 问题:只知道使用 sigmoid 函数,不知道使用一个什么样的 sigmoid 函数比较合适
      • 解决:上网搜寻,了解到对比度和亮度的一般调节公式为:在进行对比度调整时,会在像素值前面增加一个与其相乘的系数。在亮度调整时,会使用一个变量与像素值相加减
    • 问题二:

      • 问题:只考虑了 sigmoid 函数的变化趋势,而没有考虑到具体的值,函数值只在[-5,5]内有明显变化

      • 解决:在像素变换公式上进行调整

        • 原始公式为

          int t = source_image.at(y, x)[c];
          transformed_image.at(y, x)[c] = saturate_cast(t * ((contrast_value*0.1 / (1.00 + exp(-t))) + 1));
          
        • 调整后公式为

          double t = ((source_image.at(y, x)[c] - 127) / 255.00) * contrast_value * 0.1;//[-10, 10]
          transformed_image.at(y, x)[c] = saturate_cast(source_image.at(y, x)[c] * ((1.00 / (1.00 + exp(-t))) + 0.3) + bright_value - 100);
          
        • -127是为了让结果有正有负,这样像素小的会导致 1 + e − t 1+e^{-t} 1+et 更大,对比度调整之后,像素值更小。反之,像素值大的调整的程度不像像素值小的那样剧烈,因此会导致他们之间的像素差更大,因此对比度得到调整

        • /255 是为了限制 t t t 的范围,使其尽量在幂函数变化范围较明显的区域变动

        • contrast_value 就是滑动条需要改变的值,用于进行对比度调整

        • 1 1 + e − t + 0.3 \frac{1}{1+e^{-t}} + 0.3 1+et1+0.3 ,加了一个系数是因为,如果不加系数的话,只调整对比度会导致变换后的像素值永远小于原像素值,这不是我们想要的。另一个原因是,这个可以平衡一下 t t t 的作用,不让 t t t 的影响程度这么大。(加的数值大小可以自行控制)

        • bright_value 比较好理解,就是单纯对像素值进行调整,用于亮度调整

    • 问题三:利用调整公式,难以得到原图。个人认为是因为用了非线性变换,目前没有解决

    结果分析与体会

    调整效果比较明显,且都比较正常,实验结果达到预期效果

    • 使用sigmoid函数难以得到原图

    • 对比度超过一定范围就会丢失图像的真实感
      在这里插入图片描述

    在这里插入图片描述

    背景相减实验

    实验过程中遇到和解决的问题

    • 问题一

      • 问题:两张图像对应位置像素相减得到图片效果很差

    在这里插入图片描述
    误检:

    • 当图像中的像素值和背景图中对应位置像素值相差不大时,难以进行分辨,相减后前景图该位置基本为黑色,不符合预期要求。

    • 以上述图片为例,当人身上的像素值小于背景像素值时,人的像素值减去背景像素值通过防止溢出处理后,结果图像对应位置像素值为0,不符合预期要求。

      • 解决:寻找更好的解决方案,使用中值滤波去除噪声点。通过将两张图片每个像素点的三个通道的差值平方求和得到sum,然后再对sum开方。手动设定一个阈值,当sum大于这个阈值时,该像素点的三通道都设为255(白色),否则设为0(黑色)。结果发现,阈值去75—100效果最好 , 最终选定阈值为90

    结果分析与体会

    可以看到,基本将人物这一前景提取出来,但仍有噪声存在

    • 背景相减实验可以多看一些降噪的算法,因为不太容易确定相减的标准

    • 背景相减实验阈值选为90时得到的结果。轮廓清晰,达到预期效果

    在这里插入图片描述

    遇到的知识点

    at函数

    • 对于单通道图像"picture1",picture1.at(i,j)就表示在第i行第j列的像素值。

    • 对于多通道图像如RGB图像"picture2",可以用picture2.at(i,j)[c]来表示某个通道中在(i,j)位置的像素值。

    常见类型Vec3b

    Vec3b可以看作是vector<uchar, 3> , 简单而言就是一个uchar类型的,长度为3的vector向量。

    由于在OpenCV中,使用imread读取到的Mat图像数据,都是用uchar类型的数据存储,对于RGB三通道的图像,每个点的数据都是一个Vec3b类型的数据。使用at定位方法如下:
     
    img.at(row, col)[0] = 255;  // 这是指修改B通道数据
    img.at(row, col)[1] = 255;  // 这是指修改G通道数据
    img.at(row, col)[2] = 255;  // 这是指修改R通道数据
    

    point

    srcImage.at(j, i) //表示的是  j 行 i 列 的这个像素
    srcImage.at(Point(j, i)) //表示的是 坐标(j,i)的像素
    

    saturate_cast

    • saturate_cast主要是为了防止颜色溢出操作
    • 在图像处理方面,无论是加是减,乘除,都会超出一个像素灰度值的范围(0~255),saturate_cast函数的作用即是:当运算完之后,结果为负,则转为0,结果超出255,则为255。

    Mat::zeros

    • 创建一张图,每个像素的每个通道都为0
    Mat m = Mat::zeros(2, 2, CV_8UC3);//直接指明size和类型
    
    transformed_image = Mat::zeros(source_image.size(), source_image.type());//创建一个和source_image一样类型的图
    

    createTrackbar

    创建滑动条

    • 回调函数与createTrackbar配合使用
    CV_EXPORTS int createTrackbar(const String& trackbarname,
                                  const String& winname,
                                  int* value, 
                                  int count,                                        
                                  TrackbarCallback onChange = 0,
                                  void* userdata = 0);    
    
    • 滑动条名字
    • 滑动条所在窗口名字
    • 用来设置滑块的初始值,同时记录滑块以后的位置(用户改变了滑块的位置,因此value值会改变)
    • 轨迹的最大值,滑块可以滑动的范围是[0 , count]
    • 回调函数
    • 默认0,用户传给回调函数的数据,如果第三个值为全局变量,忽略这个值
    namedWindow("Transformed Window", WINDOW_AUTOSIZE);
    createTrackbar("contrast", "Transformed Window", &contrast_value, 200, ContrastAndBright , 0);
    createTrackbar("bright", "Transformed Window", &bright_value, 200, ContrastAndBright , 0);
    
    static void ContrastAndBright(int pos , void* userdata) {
        //value传值给pos , createTrackbar的第六个参数传递给userdata
        for (int y = 0; y < source_image.rows; y++)
            for (int x = 0; x < source_image.cols; x++)
                for (int c = 0; c < 3; c++){
                    double t = ((source_image.at(y, x)[c] - 127) / 225.00) * contrast_value * 0.1;
                    transformed_image.at(y, x)[c] = saturate_cast(source_image.at(y, x)[c] * ((1.00 / (1.00 + exp(-t))) + 0.3) + bright_value - 100);
                }
        imshow("Display Window", source_image);
        imshow("Transformed Window", transformed_image);
    }
    

    源码地址:Computer-Vision/实验一/源码 at main · SDU-NSY/Computer-Vision (github.com)

  • 相关阅读:
    Vue3理解(6)
    分享十万级TPS的IM即时通讯综合消息系统的架构
    为什么做的串口助手不能获取到虚拟串口,不知道是哪里出问题了,希望会的朋友解答一下,非常非常感谢
    漏刻有时物联网刷脸支付可视化大屏(柱图、支付统计、数字滚动插件numberAnimate.js、jquery.liMarquee.js插件、横向滚动字幕代码)
    【大话云原生】kubernetes灰度发布篇-从步行到坐缆车的自动化服务升级
    vscode离线安装ssh插件(本机和服务器都离线)
    一款提高测试、验证和开发效率的测试管理工具SolarManager
    2022年全球市场先进封装检测系统总体规模、主要生产商、主要地区、产品和应用细分研究报告
    若依框架集成WebSocket带用户信息认证
    BFS:多源BFS问题
  • 原文地址:https://blog.csdn.net/qq_52852138/article/details/127038134