读论文太慢 精细与速度不可兼得
总结所读涉及知识点:
1、半全局块匹配SGBM
2、立体视觉三维重建
3、VanillaCNN
4、Transformer
5、空间频域成像SFDI&结构光技术
6、注意力机制
7、Vit
1、半全局块匹配SGBM
H Hirschmüller. Stereo Processing by Semiglobal Matching and Mutual Information[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 30.
在OpenCV里有一些算法,半全局块匹配(Semi-Global Block Matching,SGBM)算法具有视差效果好速度快的特点,故常被广泛应用
1.1 计算每个像素点的代价
利用互信息熵
熵,是用来表示随机变量的不确定性,熵的值越大,信息的不确定性也越大。熵H和互信息MI的定义分别如下:
熵H的定义
其中,PI代表某个点i的概率分布,也就是灰度直方图为i的点出现的概率;对应地,PI1,I2就是两个图对应点i1和i2的联合概率分布,也就是: