
B:基线长度(两个相机之间的距离)
f:相机的焦距
d:视差(左右两张图像上同一个3D点之间的距离)
f和B是固定的,要求解深度z,只需估计视差d(xl-xr)
根
据
相
似
三
角
形
,
得
到
{
f
/
z
=
x
l
/
x
f
/
z
=
x
r
/
x
−
B
只
有
x
和
z
是
未
知
变
量
根据相似三角形,得到
得到下列式子:
Z = f B / d Z=fB/d Z=fB/d






原因分析:虽然特征包含了邻域信息,但是缺乏高层语义信息的监督信号,无法理解场景。
改进方法:用物体检测和语义分割的结果进行后处理,或者多个任务

| 距离 | 0-10m | 10-30m | 30-60m | 60-inf | 0-inf |
|---|---|---|---|---|---|
| 深度误差(RMSE) | 0.268 | 1.203 | 6.056 | 16.604 | 2.605 |
原因分析:远距离的视差值较小,在离散的图像像素上难以区分
Z
=
f
B
/
d
Z=fB/d
Z=fB/d
改进方法:①提高图像的空间分辨率(长焦),使得远距离物体也有较多的像素覆盖
②增加基线长度,从而增加视差的范围

原因分析:在该区域内无法有效提取特征,用于计算匹配误差
改进方法:提高摄像头的动态范围,或者采用可以测距的传感器
具体的仿真过程记录在下一篇里面有。