• 用于语义线检测的深度霍夫变换


    摘要

    我们专注于检测有意义的线结构的基本任务,也就是自然场景中的语义线。以往的许多方法都将此问题视为目标检测的一种特殊情况,并调整现有的目标检测器以进行语义线检测。然而,这些方法忽略了线路的固有特性,导致了性能的次优。线具有比复杂对象的更简单的几何性质,因此可以通过一些参数紧凑地参数化。为了更好地利用线的性质,本文将经典的霍夫变换技术整合到深度学习表示中,并提出了一种用于线检测的一次性端到端学习框架。通过参数化具有斜率和偏差的线,我们执行霍夫th将深度表示转换为参数域,其中我们执行线检测。具体来说,我们沿着特征映射平面上的候选线聚合特征,然后将聚合的特征分配到参数域中的相应位置。.因此,将空间域中语义线的检测问题转化为发现参数域中的单个点,使后处理步骤即非最大抑制更有效。此外,我们的方法使它容易提取上下文线特征是至关重要的准确线检测。除了该方法外,我们还设计了一个评估度量来评估线路检测的质量,并构建了一个用于线路检测任务的大规模数据集。在我们提出的数据集和另一个公共数据集上的实验结果表明,我们的方法比以前的最先进的替代方案的优势。

    论文的贡献

    • 我们提出了一个端到端框架,将CNN的特征学习能力与Hough变换结合起来,从而产生了一个有效的实时语义线检测解决方案。
    • 为了便于语义线检测的研究,我们构建了一个新的包含6500张图像的数据集,该数据集比以前的SEL数据集[11]更大、更多样化。
    • 我们引入了一个有原则的度量标准来度量两条线之间的相似性。与之前基于IOU的度量[11]相比,我们的度量有直接的解释和简单的实现,详见Sec4。
    • 在一个开放基准上的评估结果表明,我们的方法优于现有技术具有显著的提升。

    主要的改进

    • 我们提出了一种新的“边缘引导细化”模块来调整线的位置,并利用准确的边缘信息获得更好的检测性能。
    • 我们引入了一个新的大规模数据集用于语义线检测,如章节所述。 5.新的数据集,即NKL(NanKaiLines的缩写),总共包含6500张图像,每个图像都由多个熟练的注释者进行注释。
    • 我们使用最大二部图匹配[42]来匹配地面真实和检测线在评估(秒。6.1).匹配过程删除了冗余的真阳性,以便每个地面真值线最多与一条检测到的线相关联,反之亦然。

    方法

    我们给出了所提出的用于语义线检测的深度霍夫变换的细节。我们提出的方法主要包含四个部分:1)CNN编码器,提取像素级深度表示;2)深度Hough变换(DHT),将深度表示从空间域转换为参数域;3)负责检测参数空间中的线的线检测器,4)反向Hough变换(RHT)组件,将检测到的线转换回图像空间。所有这些组件都集成在一个端到端框架中,该框架在一个步骤中执行正向推理和反向训练。管道如图2所示,详细的体系结构见补充材料。

    在这里插入图片描述

    结果

    在这里插入图片描述

    在这里插入图片描述

    参考

    https://mmcheng.net/dhtline/

  • 相关阅读:
    数据结构与算法训练:第二十七、二十八弹
    第二十二章 : Docker 部署 MySQL8
    WPF中使用LiveCharts绘制散点图
    【C++】模板初阶
    getid3 获取视频时长
    C Primer Plus(6) 中文版 第1章 初识C语言 1.1 C语言的起源 1.2 选择C语言的理由 1.3 C语言的应用范围
    java Object 与String、Boolean、List、Date、Number类型相互转换
    Flutter高仿微信-第52篇-群聊-清空聊天记录
    18.Pandas的数据转换函数map、apply、applymap
    Spring-aop +redssion 实现接口限流注解
  • 原文地址:https://blog.csdn.net/weixin_42990464/article/details/127094073