如有错误,恳请指出。
paper:《PointPillars: Fast Encoders for Object Detection from Point Clouds》
PointPillars的出发点同样与SECOND一样,希望改进VoxelNet所使用3d卷积计算量太大推理速度太慢的问题。鉴于此,SECOND提出了稀疏卷积来提高普通3d卷积的推理速度,但是任然无法避免3d卷积的庞大计算量,没有从根本上解决这个问题,仍然需要使用计算昂贵的3d卷积操作。这个问题的核心本质是SECOND与VoxelNet将点云量化为三维空间上的一个个Voxel,所以3d卷积是无法避免的。
为了从根本上解决3d卷积的问题,PointPillars提出了一种新颖的量化方法(paper中写到是encoder结构,但本质上是一致的),将点云量化为二维空间上的一个个Pillars(柱),也就是取消了z轴上的bin分区,直接学习垂直列区域的点云表示。不过,这种量化方式直观上感觉会进一步量化损失的产生。
PointPillas的结构图如下所示,分为Pillar的特征提取,2d卷积操作以及最后的