近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】中,尺寸动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、角度各异也导致常见的CV框架难以实现快速精准的目标识别。
为解决广大选手作品优化难题,赛事官方特邀亚马逊云科技资深应用科学家王鹤男直播分享赛事参考框架。
DOTA数据集介绍
DOTA是用于航空图像目标检测的大型数据集。该方法可用于航拍图像中目标探测器的研制和评价。这些图像来自不同的传感器和平台。每幅图像的大小在800 × 800到20000 × 20000像素之间,包含显示各种尺寸、方向和形状的物体。DOTA图像中的实例由航空图像解译专家进行任意(8自由度)四边形标注。
摇杆光学影像目标检测算法
● 目标检测算法和框架
❖ Yolov5:
https://github.com/ultralytics/yolov5
YOLOv5是一个在COCO数据集上预训练的对象检测架构和模型家族,代表了Ultralytics对未来视觉AI方法的开源研究,结合了在数千小时的研究和开发中吸取的经验教训和最佳实践。
❖ Detectron2:
https://github.com/facebookresearch/detectron2
Detectron2是Facebook AI Research的下一代库,提供最先进的检测和分割算法。它是Detectron和maskrcnn-benchmark的继承者,支持Facebook中的许多计算机视觉研究项目和生产应用。
❖ GluonCV:
https://cv.gluon.ai/model_zoo/detection.html
GluonCV提供了最先进的(SOTA)深度学习算法在计算机视觉中的实现。它旨在帮助工程师、研究人员和学生快速制作产品原型,验证新想法并学习计算机视觉。
❖PaddleCV:
https://github.com/PaddlePaddle/models/tree/develop/PaddleCV
PaddleCV 是基于 PaddlePaddle 深度学习框架开发的智能视觉工具,算法,模型和数据的开源项目。百度在 CV 领域多年的深厚积淀为 PaddleCV 提供了强大的核心动力。PaddleCV集成了丰富的CV模型,涵盖图像分类,目标检测,图像分割,视频分类,动作定位,目标跟踪,图像生成,文字识别,度量学习,关键点检测,3D视觉等 CV 技术。
● 旋转框目标检测算法和框架
卫星遥感图像目标检测需要对角度各异的物体进行精准识别,因此,寻找能够旋转目标角度以匹配检测逻辑的算法十分重要。下面是一些值得参考的旋转框目标检测开源框架:
❖AerialDetection:https://github.com/dingjiansw101/AerialDetection
❖S2anet:https://github.com/csuhan/s2anet
❖RoI Transformer:https://github.com/dingjiansw101/RoITransformer_DOTA
❖Faster R-CNN OBB:https://github.com/jessemelpolio/Faster_RCNN_for_DOTA
❖JDet:https://github.com/Jittor/JDet
❖yolov5_obb:https://github.com/hukaixuan19970627/yolov5_obb
❖MMDetection:https://github.com/open-mmlab/mmdetection
Amazon SageMaker 功能
本次大赛要求选手将代码提交至 Amazon SageMaker 运行并取得成绩,因此,了解并掌握 Amazon SageMaker 功能及使用方法将大幅提升参赛体验与代码调优效率。
● Amazon SageMaker功能汇总
● 容器介绍
Amazon SageMaker 支持选手直接上传代码,依靠平台内置容器配置进行代码运行。另外,选手也可以自行配置容器镜像以满足自身定制化需求。
答疑
Q:网络延时解决方法?
A:可通过在requirements.txt中使用国内源,例如:
“-i https://opentuna.cn/pypi/web/simple/ ”
Q:目前支持使用哪些依赖包,有什么版本要求?
A:详见赛事详情页—数据—“镜像环境及安装包版本要求”,mmcv和mmdet目前默认没有配置,建议使用PyTorch环境。
Q:环境配置失败如何解决?
A:可以通过下方链接参考本次赛题的镜像配置。
https://github.com/aws/deep-learning-containers/blob/master/available_images.md
也可以实际将镜像下载到本地模拟运行:
$(aws ecr get-login --region cn-northwest-1 --registry-ids 727897471807 --no-include-email)
docker pull 727897471807.dkr.ecr.cn-northwest-1.amazonaws.com.cn/pytorch-training:1.10-gpu-py38
docker pull 727897471807.dkr.ecr.cn-northwest-1.amazonaws.com.cn/tensorflow-training:2.7-gpu-py38