1、VOC数据集下载
ubuntu系统下打开终端输入命令即可下载
- wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
- wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
- wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
- wget https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
- wget http://pjreddie.com/media/files/VOC2012test.tar
VOC数据集的来源详解看详解 VOC 数据集_我是土堆的博客-CSDN博客_voc数据集
总结来说就是VOC是伴随比赛而生的,这个比赛2012年就停止了,所以数据集也只到2012。VOC常用的是2007及2012,因为其他年份数据太少而不常用
2、VOC数据集介绍
前部分详细介绍可以看https://www.jianshu.com/p/ab72f21de665
a、VOC2007
Annotations中存放的是图片的标注信息,有图片名称、图片大小、图片包含的object种类及object的boundingbox(bndbox),往后根据bndbox制作目标检测时需要的真值,有的xml中包含人的part字段,part中包含head,head、foot、等(不知道为什么有的人有有的人没有)
ImageSets
VOC2007数据集详细分析_大彤小忆的博客-CSDN博客_voc2007
Layout、Main、Segmentation分别是三个任务对应的数据集列表
其中Main是目标检测数据集用的、Layout(不知道是什么任务)、Segmentation(分割)
Main
共有84个.txt文件,其中4个文件为训练集train.txt、验证集val.txt、训练集和验证集汇总trainval.txt、测试集test.txt,这4个文件里面保存的是图像的ID号;还有20类目标,每个类别有该类的类别名_train.txt、类别名_val.txt、类别名_trainval.txt、类别名_test.txt这4个文本,共80个文件。这80个文件中每一行的图像ID后面还跟了一个数字,要么是-1, 要么是1,有时候也可能会出现0。:-1表示当前图像中,没有该类物体;1表示当前图像中有该类物体;0表示当前图像中,该类物体只露出了一部分。
JPEGImages
原图
SegmentationClass
语义分割标签图(同种类别物体不区分1,2,3)
SegmentationObject
实例分割标签图(同种类别物体区分1,2,3)
b、VOC2012
同样也是2007中的五个文件夹
但是
Annotations
相比2007的xml多了2008、2009、2010、2011、2012的xml,2010-2012的xml文件中多了action的动作
ImageSets
相比VOC2007多了Action文件夹,Action文件夹中是所有具有Action信息的图像文件名列表,Layout是包含Layout的图像文件名列表,Main中同上