作者:翟天保Steven
版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处
大家在工作和学习中,无论是写报告还是论文,经常有截图的需求,比如图表、图纸等,但是截下来的图像往往是失真模糊的,此时如果可以用算法基于某种逻辑处理下,会使图像效果好很多。
本文基于阴影识别算法写了一个图纸清晰度增强算法:图纸的特征就是背景色和字体色颜色相对单调,将所有字体和图表框用识别算法提取勾勒出来,对其进行提亮或加暗就能有直观的效果。图像分辨率方面按需求用CUBIC插值扩展。
图像阴影算法不了解的同学可以参考:
OpenCV-图像阴影调整_opencv 添加阴影-CSDN博客
下方介绍基于阴影勾勒的图纸清晰度增强算法的具体流程。
1)读取识别图像的原图,用CUBIC插值算法进行了长宽的4倍扩展。
- // 读取图像
- cv::Mat src = imread("test.jpg", 0);
- // 如果图像无法加载,则输出错误信息并返回
- if (src.empty())
- {
- std::cout << "Could not open or find the image" << std::endl;
- return -1;
- }
- // 尺寸扩大至4倍,用CUBIC插值算法,更平滑
- Mat enlargedImage;
- cv::resize(src, enlargedImage, Size(), 4.0, 4.0, INTER_CUBIC);
2)同样是“像”,插值后的像素感没那么重。
3)像素归一化后,通过(1-gray)*(1-gray)得到thresh图像,图像中原本暗的地方则为亮,取平均值当阈值,进行二值化得到掩膜mask。下图分别是thresh和mask。
- // 像素归一化
- cv::Mat gray;
- input.convertTo(gray, CV_32FC1);
- gray /= 255.f;
- // 确定阴影区
- cv::Mat thresh = cv::Mat::zeros(gray.size(), gray.type());
- thresh = (1.0f - gray).mul(1.0f - gray);
- // 取平均值作为阈值
- float t = mean(thresh)[0];
- cv::Mat mask = cv::Mat::zeros(gray.size(), CV_8UC1);
- mask.setTo(255, thresh >= t);
4)根据midrate和brightrate,进行阴影区调整。假设输入的调整值为-50,对非阴影区而言,midrate都为1,brightrate都为0,即没有变化;对阴影区而言,midrate都为0.5,brightrate都为-0.125,所以色彩数值均有所增加,带来了变暗效果;对边缘地区,midrate和brightrate起到了很好的过渡作用。下图是midrate,brightrate因为看起来都是黑色的就不展示了。
- // 参数设置
- int max = 4;
- float bright = light / 100.0f / max;
- float mid = 1.0f + max * bright;
- // 边缘平滑过渡
- cv::Mat midrate = cv::Mat::zeros(input.size(), CV_32FC1);
- cv::Mat brightrate = cv::Mat::zeros(input.size(), CV_32FC1);
- for (int i = 0; i < input.rows; ++i)
- {
- uchar *m = mask.ptr<uchar>(i);
- float *th = thresh.ptr<float>(i);
- float *mi = midrate.ptr<float>(i);
- float *br = brightrate.ptr<float>(i);
- for (int j = 0; j < input.cols; ++j)
- {
- if (m[j] == 255)
- {
- mi[j] = mid;
- br[j] = bright;
- }
- else
- {
- mi[j] = (mid - 1.0f) / t * th[j] + 1.0f;
- br[j] = (1.0f / t * th[j])*bright;
- }
- }
- }
5)对阴影进行调整。
- // 阴影提亮或变暗,获取结果图
- cv::Mat result = cv::Mat::zeros(input.size(), input.type());
- for (int i = 0; i < input.rows; ++i)
- {
- float *mi = midrate.ptr<float>(i);
- float *br = brightrate.ptr<float>(i);
- uchar *in = input.ptr<uchar>(i);
- uchar *r = result.ptr<uchar>(i);
- for (int j = 0; j < input.cols; ++j)
- {
- for (int k = 0; k < 3; ++k)
- {
- float temp = pow(float(in[j]) / 255.f, 1.0f / mi[j])*(1.0 / (1 - br[j]));
- uchar utemp = uchar(255 * temp);
- r[j] = utemp;
- }
- }
- }
- // C++常用头文件
- #include <algorithm>
- #include <chrono>
- #include <ctime>
- #include <cstdio>
- #include <cstdlib>
- #include <cstring>
- #include <direct.h>
- #include <functional>
- #include <fstream>
- #include <filesystem>
- #include <iostream>
- #include <io.h>
- #include <map>
- #include <numeric>
- #include <omp.h>
- #include <random>
- #include <regex>
- #include <stdio.h>
- #include <sstream>
- #include <string>
- #include <set>
- #include <time.h>
- #include <thread>
- #include <unordered_map>
- #include <unordered_set>
- #include <utility>
- #include <vector>
- #include <Windows.h>
- // 第三方相关头文件
- #include <opencv2/opencv.hpp>
- #include <opencv2/imgproc/imgproc.hpp>
- #include <opencv2/highgui/highgui.hpp>
- #include <opencv2/core/core.hpp>
- #include <opencv2/core/fast_math.hpp>
-
- // 引入命名空间
- using namespace std;
- using namespace cv;
-
- // 图像阴影亮暗调整
- cv::Mat Shadow(cv::Mat input, int light)
- {
- // 像素归一化
- cv::Mat gray;
- input.convertTo(gray, CV_32FC1);
- gray /= 255.f;
-
- // 确定阴影区
- cv::Mat thresh = cv::Mat::zeros(gray.size(), gray.type());
- thresh = (1.0f - gray).mul(1.0f - gray);
- // 取平均值作为阈值
- float t = mean(thresh)[0];
- cv::Mat mask = cv::Mat::zeros(gray.size(), CV_8UC1);
- mask.setTo(255, thresh >= t);
-
- // 参数设置
- int max = 4;
- float bright = light / 100.0f / max;
- float mid = 1.0f + max * bright;
-
- // 边缘平滑过渡
- cv::Mat midrate = cv::Mat::zeros(input.size(), CV_32FC1);
- cv::Mat brightrate = cv::Mat::zeros(input.size(), CV_32FC1);
- for (int i = 0; i < input.rows; ++i)
- {
- uchar *m = mask.ptr<uchar>(i);
- float *th = thresh.ptr<float>(i);
- float *mi = midrate.ptr<float>(i);
- float *br = brightrate.ptr<float>(i);
- for (int j = 0; j < input.cols; ++j)
- {
- if (m[j] == 255)
- {
- mi[j] = mid;
- br[j] = bright;
- }
- else
- {
- mi[j] = (mid - 1.0f) / t * th[j] + 1.0f;
- br[j] = (1.0f / t * th[j])*bright;
- }
- }
- }
-
- // 阴影提亮,获取结果图
- cv::Mat result = cv::Mat::zeros(input.size(), input.type());
- for (int i = 0; i < input.rows; ++i)
- {
- float *mi = midrate.ptr<float>(i);
- float *br = brightrate.ptr<float>(i);
- uchar *in = input.ptr<uchar>(i);
- uchar *r = result.ptr<uchar>(i);
- for (int j = 0; j < input.cols; ++j)
- {
- for (int k = 0; k < 3; ++k)
- {
- float temp = pow(float(in[j]) / 255.f, 1.0f / mi[j])*(1.0 / (1 - br[j]));
- uchar utemp = uchar(255 * temp);
- r[j] = utemp;
- }
-
- }
- }
- return result;
- }
-
- int main()
- {
- // 读取图像
- cv::Mat src = imread("test.jpg", 0);
-
- // 如果图像无法加载,则输出错误信息并返回
- if (src.empty())
- {
- std::cout << "Could not open or find the image" << std::endl;
- return -1;
- }
-
- // 尺寸扩大至4倍,用CUBIC插值算法,更平滑
- Mat enlargedImage;
- cv::resize(src, enlargedImage, Size(), 4.0, 4.0, INTER_CUBIC);
-
- // 图像阴影变暗:起到黑色字体颜色加深的效果
- cv::Mat shadow = Shadow(enlargedImage, -50);
-
- cout << "finish." << endl;
- return 0;
- }
从测试效果中可以看出,因为尺寸进行了插值,所以像素感没那么明显,同时对阴影进行了变暗,整体感受会好很多,增强了图像的整体清晰度。
如果函数有什么可以改进完善的地方,非常欢迎大家指出,一同进步何乐而不为呢~
如果文章帮助到你了,可以点个赞让我知道,我会很快乐~加油!