为了在工作环境中有效地应用机器人并协助人类,开发和评估视觉接地 (VG) 如何影响被遮挡物体上的机器性能至关重要。然而,当前的 VG 工作仅限于工作环境,例如办公室和仓库,由于空间利用问题,对象通常被遮挡。在我们的工作中,我们提出了一个新颖的 OCID-Ref 数据集,该数据集具有一个引用表达式分割任务和被遮挡对象的引用表达式。OCID-Ref 由来自 2,300 个场景的 305,694 个引用表达式组成,并提供 RGB 图像和点云输入。为了解决具有挑战性的遮挡问题,我们认为利用 2D 和 3D 信号来解决具有挑战性的遮挡问题至关重要。我们的实验结果证明了聚合 2D 和 3D 信号的有效性,但对于现代视觉接地系统而言,提及被遮挡的物体仍然具有挑战性。OCID-Ref 项目开源地址