目录
高斯模糊是非常常见的一种图像模糊方式,简单说就是将每个像素点和周围像素点,以某种方式进行混合, 实现既不改变原图的大致形态,看上去还是原来的样子,但却模糊了的效果,如图1-1所示. 查阅很多资料,发现大多数都是对高斯模糊侃侃而谈,但是没有讲到数学计算的细节,算子到底是如何得到的. 高斯模糊涉及到了数学概率的正态分布, 有一点点的复杂度. 在此我们就是要从“0”开始说清楚这个高斯模糊的来龙去脉,前世今生.
图2-1是人类的智商分布比例,大多数人的智商集中在85-115,超高和超低智商的人只占很小的比例,柱状图可用一条曲线拟合,如图中红色曲线所示. 这个钟形曲线就是正态分布曲线. 正态分布曲线体现了宇宙中很多事物的分布规律,比如全国身高的分布,年级考试成绩的分布,气体分子运动速度的分布,抛10个硬币1000次正面向上的次数分布,等等都符合正态分布.
正态分布,可描述某事件大量发生时的分布规律,或某事件单独发生的可能性,也就是概率. 事件发生后,可用统计解释,发生前可用概率预测. 图2-2的装置叫做高尔顿钉板,可验证大量重复试验的结果符合正态分布. 小球从顶部落下,会经过很多钉子,每碰到一个钉子,小球弹向左边或右边的概率都是1/2,落在最左边或者最右边的概率非常低,落在中间的概率最高,所以可以用正态分布描述小球落入区间的分布.
正态分布用数学公式表达就是
曲线表示概率密度变化,x轴数值表示试验结果,函数值是这个结果对应的概率, 比如某人智商是x=130的概率是f(x),或者说人类中智商是x=130的所占的比例是𝑓𝑥.. 曲线积分(曲线和x轴围成的面积)等于1,即所有可能的情况(x的取值值)的概率和(求积分)是1,比如某人的智商是
x∈[0-150](全部可能性)的概率是1.
𝑥=μ,对应钟形曲线最高点,μ是x的概率加权平均值,叫期望E(X),期望就是平均值,比如智商统计的曲线中μ=100,那么人类的平均智商就是100. μ=0时,平均值就是0,如图.小明和小红的智商是90和110,平均值是:(90+110)/2=100
𝜎2σ^2的平方是方差,即
即所有x与平均值的差,平方,求和,最后平均. 方差表示样本的平均波动大小,比如小明和小红的智商是90和110,平均值是100,方差是[(90-100)^2+(110-100)^2 ]/2=100,再比如小明和小红的智商是50和150,平均值也是100,但是方差(波动性)要大得多, [(50-100)^2+(150-100)^2 ]/2=2500
图像的模糊算法有很多,比如有:
均值模糊:将中心像素和周围像素颜色数值加起来求平均,作为中心像素的模糊结果
中值模糊:把中心像素和周围像素的颜色排个顺序,取中间像素的颜色数值作为模糊结果
高斯模糊:中间像素和周围像素对模糊的权重(重要性)不一样,且权重遵循正态分布,进行加权平均. 换句话说,高斯模糊就是参与模糊的像素(中间像素和周围像素)的重要性,符合正态分布,所以按照正态分布的规律加权平均就是最后的模糊数值,中间像素权重(百分比)最大,越往边上,权重(百分比)越小,且所有的权重(百分比)的和应该是1,即100%. 正态分布又叫做高斯分布,所以这种模糊又叫高斯模糊. 中间像素的权重最大,对应钟形曲线最高点,左右像素的权重对称相等,所以𝜇μ=0 ,曲线关于y轴对称;𝜎σ决定了曲线的陡峭程度,𝜎=1σ=1的曲线相对平滑,那么模糊也会相对平滑. 高斯模糊的像素权重分布,采用的正态分布函数如下:
正态分布是连续的,纹理采样点是离散问题有限的,对于每个纹素,不可能采样整张图像,按照正态分布加权平均,最后生成该纹素点的模糊值. 出于效率考虑,假设在目标纹素左右,以Δx为间隔,各采样2个点,包括中心的目标纹素共5个点,如图2-5. 那么应该将这5个点,映射在正态分布多大的范围内,来取得权重呢?正态分布的样本空间是[-∞,+∞], 在 图2-5中,当 x∈[μ-2σ,μ+2σ] 时,概率(权重)总和已经达到95%, 接近100%,再靠边缘的样本对最后结果的贡献非常非常小, 所以仅需要在正态分布的[μ-2σ,μ+2σ]区间中计算权重即可.
当分布函数为
即μ=0,σ=1时,区间-2,+2]权重占到95%. 那么5个纹理采样点,映射到正态分布的区间[-2,+2]上,得到正态分布曲线的x值为-2,-1,0,1,2,得到5个纹理采样点对应的5个权重值,或者说这5个纹素对于目标纹素点模糊的贡献比例为:
但这些权重加起来不是1,而是
在[-2,+2]区间,权重总和不是应该占95%吗,怎么是99%呢?这是因为,这个95%是积分计算的结果,而此处的结果是离散数据计算的.如图2-5-2
图像是二维的,那么模糊权重也应该是二维的,所以将正态分布从一维扩展到二维,公式为:
3D 图像如图2-6所示. 二维的高斯算子,是x,y两个参数共同决定的, 离远点越近,权重值越大. 如果在目标纹素周围5*5的范围采样,需要把这25个纹素采样点映射到x∈[-2,+2],y∈[-2,+2]的区间内的25个(x,y)坐标,计算得到25个权重,再对25个纹理采样颜色分别乘以权重,得到加权求平均值,即最终的高斯模糊颜色,如图2-7所示.
如果一张图像的尺寸是w*h,上述二维高斯核需要25*w*h次采样并计算,如何才能降低计算成本,又不必大幅度损失效果呢? 可以简化采样方式,采用2个方向的一维高斯核采样,如图2-8,这样仅需要5*w*h+5*w*h次采样,垂直水平方向分别进行一次高斯模糊的计算,既提高了效率,又不至于效果太差. 后续的代码实现中也将采用这种简化的二维高斯核计算权重. 注意,此处的一维权重是使用图2-5中的归一化的一维权重,因为此时是用2个方向的一维权重(不是二维权重图中9/25的那些部分),分别执行一次独立运算(但效果是叠加的).
高斯模糊的实现分成两个部分,c#和shader. 因为这是一种图像后处理,意思就是先要渲染场景,等到场景渲染结束,变成一张纹理(图像),然后再对这张图象进行处理. 场景渲染结束后会调用我们的c#函数,该函数再调用shader中的pass,进行真正的模糊处理. 因为pass是用GPU计算的,速度不是一个等级,这也是调来调去的原因所在.
具体到实现中,此处使用Unity提供的C#接口:
MonoBehaviour.OnRenderImage(RenderTextrue src,RenderTextrue dest)
该函数需要在继承MonoBehaviour的脚本中定义,并且必须将脚本绑定到摄像机. OnRenderImage函数会在所有不透明和透明Pass执行完毕后调用. 如果希望不透明Pass(即渲染你队列<=2500的Pass,包括内置Background,Geometry,AlphaTest)执行完毕立刻调用函数,可在函数定义中加[ImageEffectOpaque]特性来实现.
屏幕图像将传入OnRenderImage的参数src,再通过Graphics.Blit函数调用特定Shader来处理,再把处理的结果放在dest参数中,最后显示到屏幕上, 在一些复杂的屏幕特效中,可能会多次调用Graphics.Blit函数.调用过程如图3-1
- using UnityEngine;
-
- [ExecuteInEditMode]//编辑模式也可以看到效果
- [RequireComponent(typeof(Camera))]//只能绑定到有Camera脚本的GameObject上
- public class GuassBlur : MonoBehaviour
- {
- public Shader edgeDetectShader; //调用的材质球
- private Material edgeDetectMaterial = null;//该材质球动态生成
-
- //高斯模糊的迭代次数,次数越大越模糊.
- [Range(0, 4)]
- public int iterations = 3;
- //模糊范围,每次模糊处理的采样范围为 1+ 迭代次数 * blurSpread
- [Range(0.2f, 3.0f)]
- public float blurSpread = 0.6f;
- //降采样数,图像尺寸变为原来的(1/downSample,1/downSample)进行模糊,降低太多容易有马赛克感
- [Range(1, 8)]
- public int downSample = 2;
- public Material material
- {
- get
- {
- edgeDetectMaterial = CheckShaderAndCreateMaterial(edgeDetectShader, edgeDetectMaterial);
- return edgeDetectMaterial;
- }
- }
- void OnRenderImage(RenderTexture src, RenderTexture dest)
- {
- if (material != null)
- {
- //计算过降低后的图像尺寸
- int rtW = src.width / downSample;
- int rtH = src.height / downSample;
- //new缓存
- RenderTexture buffer0 = RenderTexture.GetTemporary(rtW, rtH, 0);
- //原图像和降采样后图像之间使用双线性滤波转换,本身也会带来一定的模糊效果
- buffer0.filterMode = FilterMode.Bilinear;
- //原图-> 小图
- Graphics.Blit(src, buffer0);
- //进行iterations次高斯模糊处理
- for (int i = 0; i < iterations; i++)
- {
- //设置采样间隔
- material.SetFloat("_BlurSize", 1.0f + i * blurSpread);
- RenderTexture buffer1 = RenderTexture.GetTemporary(rtW, rtH, 0);
-
- //调用第0个pass,进行垂直方向的高斯模糊
- Graphics.Blit(buffer0, buffer1, material, 0);
-
- RenderTexture.ReleaseTemporary(buffer0);
- buffer0 = buffer1;
- buffer1 = RenderTexture.GetTemporary(rtW, rtH, 0);
-
- //调用第1个pass,进行垂直方向的高斯模糊
- Graphics.Blit(buffer0, buffer1, material, 1);
-
- RenderTexture.ReleaseTemporary(buffer0);
- buffer0 = buffer1;
- }
- //高斯模糊的小图 -> 大图
- Graphics.Blit(buffer0, dest);
- RenderTexture.ReleaseTemporary(buffer0);
- }
- else
- {
- Graphics.Blit(src, dest);
- }
- }
- //检查、生成、返回材质球
- protected Material CheckShaderAndCreateMaterial(Shader shader, Material material)
- {
- if (shader == null)
- {
- return null;
- }
- if (shader.isSupported && material && material.shader == shader)
- return material;
- if (!shader.isSupported)
- {
- return null;
- }
- else
- {
- material = new Material(shader);
- material.hideFlags = HideFlags.DontSave;
- if (material)
- return material;
- else
- return null;
- }
- }
- }
-
- Shader "MyShader/PostEffect/GuassBlur" {
- Properties{
- _MainTex("Base (RGB)", 2D) = "white" {}
- _BlurSize("Blur Size", Float) = 1.0
- }
- SubShader{
- CGINCLUDE
-
- #include "UnityCG.cginc"
-
- sampler2D _MainTex;
- half4 _MainTex_TexelSize;//单位纹素大小
- float _BlurSize;//采样间隔
-
- struct v2f {
- float4 pos : SV_POSITION;
- half2 uv[5]: TEXCOORD0;
- };
- //顶点着色-垂直模糊Pass
- v2f vertBlurVertical(appdata_img v) {
- v2f o;
- o.pos = UnityObjectToClipPos(v.vertex);
-
- half2 uv = v.texcoord;
- //设置垂直方向的采样坐标
- o.uv[0] = uv + float2(0.0, _MainTex_TexelSize.y * 2.0) * _BlurSize;
- o.uv[1] = uv + float2(0.0, _MainTex_TexelSize.y * 1.0) * _BlurSize;
- o.uv[2] = uv;
- o.uv[3] = uv - float2(0.0, _MainTex_TexelSize.y * 1.0) * _BlurSize;
- o.uv[4] = uv - float2(0.0, _MainTex_TexelSize.y * 2.0) * _BlurSize;
- return o;
- }
- //顶点着色-水平模糊Pass
- v2f vertBlurHorizontal(appdata_img v) {
- v2f o;
- o.pos = UnityObjectToClipPos(v.vertex);
-
- half2 uv = v.texcoord;
- //设置水平方向的采样坐标
- o.uv[0] = uv + float2(_MainTex_TexelSize.x * 2.0, 0.0) * _BlurSize;
- o.uv[1] = uv + float2(_MainTex_TexelSize.x * 1.0, 0.0) * _BlurSize;
- o.uv[2] = uv;
- o.uv[3] = uv - float2(_MainTex_TexelSize.x * 1.0, 0.0) * _BlurSize;
- o.uv[4] = uv - float2(_MainTex_TexelSize.x * 2.0, 0.0) * _BlurSize;
-
- return o;
- }
- //片元着色
- fixed4 fragBlur(v2f i) : SV_Target {
- //高斯模糊权重
- float weight[5] = { 0.0545,0.2442,0.4026, 0.2442, 0.0545};
-
- //中心纹理*权重
- fixed3 sum = 0;
- //上下/左右 的2个纹理*权重
- for (int n = 0; n < 5; n++) {
- sum += tex2D(_MainTex, i.uv[n]).rgb * weight[n];
- }
- return fixed4(sum, 1.0);
- }
-
- ENDCG
-
- ZTest Always Cull Off ZWrite Off
-
- Pass {
- NAME "GAUSSIAN_BLUR_VERTICAL"
-
- CGPROGRAM
-
- #pragma vertex vertBlurVertical
- #pragma fragment fragBlur
-
- ENDCG
- }
-
- Pass {
- NAME "GAUSSIAN_BLUR_HORIZONTAL"
-
- CGPROGRAM
-
- #pragma vertex vertBlurHorizontal
- #pragma fragment fragBlur
-
- ENDCG
- }
- }
- FallBack Off
- }
[1] 《UnityShader 入门精要》
[2] “A First Course in Probility (9e)”