【双目视觉】立体匹配算法原理之“代价空间与聚合、视差计算”

【双目视觉】立体匹配算法原理之“代价空间与聚合、视差计算”
文章目录
- 预备知识
  代价空间
  代价聚合
  Box Filtering（均值滤波）
  Bilateral filter
  Cross-based local stereo matching(自适应形状)
  🚀Semi-Global Matching
预备知识
1. 【双目视觉】理想条件下计算物体距离_什么都只会一点的博客-CSDN博客
2. 【双目视觉】立体匹配算法原理之“代价函数”_什么都只会一点的博客-CSDN博客
代价空间

$C_{A D}(x, y, d)=\left|I_{L}(x, y)-I_{R}(x-d, y)\right|$

d是移动像素的大小。以左图为基准。下面以左图的一个像素点P为例
1. d=0，右图不移动，计算 $C_{AD0}$
2. d=1，右图向右移动一个像素点，再计算 $C_{AD1}$
3. d=2，右图向右移动一个像素点，再计算 $C_{AD2}$
4. …(d++，不断执行)…
5. 最后得到代价空间
代价聚合

🔥目的：对代价空间进行滤波，使边界平滑

 Box Filtering（均值滤波）

$C_{d}^{A}(p)=\frac{1}{N} \sum_{q} C_{d}(q)$

N：窗口像素个数

效果：

Bilateral filter

Bilateral filter就是输入的代价，乘以一个高斯函数，实现平滑

效果：

Cross-based local stereo matching(自适应形状)

任意选取一个像素点，横向、纵向扩张，直到遇到颜色差异较大的地方才停下来。然后在扩张后的像素点，重复上述操作。这样，因为能及时发现边界，就能大概判断出一整块区域的视差图

 🚀Semi-Global Matching

能量函数

$\begin{aligned} E (D) = & \sum_{p} (C (p, D_{p}) + \sum_{q \in N_{p}} P_{1} T [| D_{p} - D_{q} | = 1] & + \sum_{q \in N_{p}} P_{2} T [| D_{p} - D_{q} | > 1]) \end{aligned}$
E(D)=p∑⎝ ⎛C(p,Dp)+q∈Np∑P1 T[∣Dp−Dq∣=1]+q∈Np∑P2 T[∣Dp−Dq∣>1]⎠ ⎞

当 $D_p-D_q = 1$ 时，我们就取 $\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{1} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|=1\right]$

当 $D_p-D_q > 1$ ，我们就取 $\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{2} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|>1\right]$

优化步骤
1. 计算代价空间；(AD, BT, Census, MI, ….)
2. 代价聚合
  
  方向r上的路径代价
  
  $\begin{aligned} L_{r} (p, d) = & C (p, d) + min (L_{r} (p - r, d) \\ L_{r} (p - r, d - 1) + P_{1} \\ L_{r} (p - r, d + 1) + P_{1} \\ min_{i} L_{r} (p - r, i) + P_{2}) - min_{k} L_{r} (p - r, k) \end{aligned}$ $L_{r} (p, d) = C (p, d) + min (L_{r} (p - r, d) L_{r} (p - r, d - 1) + P_{1} L_{r} (p - r, d + 1) + P_{1} i min L_{r} (p - r, i) + P_{2}) - k min L_{r} (p - r, k)$
  当d=0时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$
  
  当|d|=1时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)+P_1-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$
  
  当|d|=i时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)+P_2-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$
  
  $L_r(p-r,d)$ 是该像素点左侧，最优代价。即当d=i时，左侧有最优代价，那么就 $C(\mathbf{p}, d)+P_2$
  
  各个方向的总聚合代价
  $S(\mathbf{p}, d)=\sum L_{\mathbf{r}}(\mathbf{p}, d)$
  例如opencv收录的sgbm算法，就是计算了下面5条路径的代价
3. WTA
  
  Winner-Take-All,赢家通吃
  
  即我们发现在这条视差方向r上，纵轴（聚合后的代价）最小，那么我们就取出视差值（d=18）
4. 视差后处理
相关阅读:
大聪明教你学Java | SpringBoot 项目里如何在拦截器中获取 @RequestBody 参数
 【嵌入式面试题】常见的面试题梳理一
 你了解Postman 变量吗？
2022新高考II卷数学题解
 中国本土Tier1加速崛起，这家ADAS厂商如何在多赛道领跑？
关于Flutter doctor里两个警告的消除
 分布式系统设计模式和一致性协议，你用过哪些？
messageBox的入门学习
 李宏毅机器学习代码——预测COVID-19人数
 详解3dMax中渲染线框的两种简单方法
原文地址：https://blog.csdn.net/henghuizan2771/article/details/126260760

【双目视觉】 立体匹配算法原理之“代价空间与聚合、视差计算”

文章目录

预备知识

代价空间

代价聚合

Box Filtering（均值滤波）

Bilateral filter

Cross-based local stereo matching(自适应形状)

🚀Semi-Global Matching