Microsoft COCO(Common Objects in Context)是微软研发维护的一个大型的数据集。包含了30多万张图片和91个目标分类。可用于目标识别(Object Detection)、场景感知(Penoptic Segmentation)、语义分割(Stuff Segmentation)、标题生成(Image Captioning)等任务。
1 数据集下载
MS COCO数据集可以通过官方网站下载
https://cocodataset.org/#home
进入下载页面
https://cocodataset.org/#download
2017相关的为最新发布的数据集
包含三个图像数据文件(Train、Val、Test)和系列标注文件,针对不同的识别任务。
数据下载后解压,产生四个子目录,分别train2017、val2017、test2017和annotations。其中前面三个为训练、评估、测试的图像数据,annotations目录为这些图像的标注信息。包含针对多种任务类型的标注。目录结构如下
train2017 #训练图像目录
val2017 #评估图像目录
test2017 #测试图像目录
annotations #标注文件夹
├── captions_train2017.json #图像标题标注(训练集)
├── captions_val2017.json #图像标题标注(评估集)
├── instances_train2017.json #目标检测、语义分割标注(训练集)
├── instances_val2017.json #目标检测、语义分割标注(评估集)
├── panoptic_train2017.json #全景感知标注(训练集)
├── panoptic_val2017.json #全景感知标注(评估集)
├── person_keypoints_train2017.json #人体关键点检测标注(训练集)
├── person_keypoints_val2017.json #人体关键点检测标注(评估集)
├── stuff_train2017.json #目标检测、语义分割标注(训练集)
└── stuff_val2017.json #目标检测、语义分割标注(评估集)