是基于对应像素点间的误差,即基于误差敏感的图像质量评价,由于并未考虑到人眼的视觉特性(人眼对空间频率较低的对比差异敏感度较高,人眼对亮度对比差异的敏感度较色度高,人眼对一个 区域的感知结果会受到其周围邻近区域的影响等),因而经常出现评价结果与人的主观感觉不一致的情况。必须满足两张图像的size要完全一样。
计算时必须满足两张图像的size要完全一样!
对于单色图像来说,给定一个大小为m×n的干净图像I和噪声图像K,均方误差(MSE)定义为:
然后PSNR(dB)就定义为:
其中MAXI是表示图像点颜色的最大数值,如果每个采样点用 8 位表示,那么就是 255,如果每个采样点用 n 位二进制表示,则MAXI=2^n-1。
因此MSE越小,PSNR越大,代表图像质量越好。
PSNR高于40dB说明图像质量极好(即非常接近原始图像)
在30—40dB通常表示图像质量是好的(即失真可以察觉但可以接受)
在20—30dB说明图像质量差
PSNR低于20dB图像不可接受
可以衡量图片的失真程度,也可以衡量两张图片的相似程度。与MSE和PSNR衡量绝对误差不同,SSIM是感知模型,即更符合人眼的直观感受。
SSIM 主要考量图片的三个关键特征:
亮度(Luminance):亮度以平均灰度衡量,通过平均所有像素的值得到
对比度(Contrast):对比度通过灰度标准差来衡量。标准差无偏估计:
结构 (Structure):
α β γ 分别代表了不同特征在SSIM衡量中的占比,在实际计算中一般设定α = β = γ = 1,以及c 3 = c 2 / 2 ,因此公式可以化简为:
每次计算的时候都从图片上取一个N×N的窗口,然后不断滑动窗口进行计算,最后取平均值作为全局的 SSIM。
基于学习的感知相似度度量LPIPS 比传统方法(比如L2/PSNR, SSIM, FSIM)更符合人类的感知情况。来源于论文《The Unreasonable Effectiveness of Deep Features as a Perceptual Metric》
LPIPS的值越低表示两张图像越相似,反之,则差异越大