在计算机视觉众多的技术领域中,目标检测(Object Detection)也是一项非常基础的任务,图像分割、物体追踪、关键点检测等通常都要依赖于目标检测。在目标检测时,由于每张图像中物体的数量、大小及姿态各有不同,也就是非结构化的输出。
计算机视觉中,图像分类、目标检测和图像分割都属于基础、也是目前发展最为迅速的3个领域,下面具体看一下这几个任务之间的区别。
图像分类:输入图像往往仅包含一个物体,目的是判断每张图像是什么物体,是图像级别的任务,相对简单,发展也最快。
目标检测:输入图像中往往有很多物体,目的是判断出物体出现的位置与类别,是计算机视觉中非常核心的一个任务。
图像分割:输入与物体检测类似,但是要判断出每一个像素属于哪一个类别,属于像素级的分类。图像分割与目标检测任务之间有很多联系,模型也可以相互借鉴。
目标检测技术,通常是指在一张图像中检测出物体出现的位置及对应的类比,要求检测器输出5个value:物体类别class、bounding box左上角x坐标x、bounding box左上角y坐标y、bounding box右下角x坐标x、bounding box右下角y坐标y。如右图所示,目标检测能够大致的识别出图片的物体以及物体所在位置并标注出来。