## 数据集准备 | |
MMDetection 支持多个公共数据集,包括 [COCO](https://cocodataset.org/), [Pascal VOC](http://host.robots.ox.ac.uk/pascal/VOC), [Cityscapes](https://www.cityscapes-dataset.com/) 和 [其他更多数据集](https://github.com/open-mmlab/mmdetection/tree/main/configs/_base_/datasets)。 | |
一些公共数据集,比如 Pascal VOC 及其镜像数据集,或者 COCO 等数据集都可以从官方网站或者镜像网站获取。注意:在检测任务中,Pascal VOC 2012 是 Pascal VOC 2007 的无交集扩展,我们通常将两者一起使用。 我们建议将数据集下载,然后解压到项目外部的某个文件夹内,然后通过符号链接的方式,将数据集根目录链接到 `$MMDETECTION/data` 文件夹下, 如果你的文件夹结构和下方不同的话,你需要在配置文件中改变对应的路径。 | |
我们提供了下载 COCO 等数据集的脚本,你可以运行 `python tools/misc/download_dataset.py --dataset-name coco2017` 下载 COCO 数据集。 对于中国境内的用户,我们也推荐通过开源数据平台 [OpenDataLab](https://opendatalab.com/?source=OpenMMLab%20GitHub) 来下载数据,以获得更好的下载体验。 | |
更多用法请参考[数据集下载](./useful_tools.md#dataset-download) | |
```text | |
mmdetection | |
├── mmdet | |
├── tools | |
├── configs | |
├── data | |
│ ├── coco | |
│ │ ├── annotations | |
│ │ ├── train2017 | |
│ │ ├── val2017 | |
│ │ ├── test2017 | |
│ ├── cityscapes | |
│ │ ├── annotations | |
│ │ ├── leftImg8bit | |
│ │ │ ├── train | |
│ │ │ ├── val | |
│ │ ├── gtFine | |
│ │ │ ├── train | |
│ │ │ ├── val | |
│ ├── VOCdevkit | |
│ │ ├── VOC2007 | |
│ │ ├── VOC2012 | |
``` | |
有些模型需要额外的 [COCO-stuff](http://calvin.inf.ed.ac.uk/wp-content/uploads/data/cocostuffdataset/stuffthingmaps_trainval2017.zip) 数据集,比如 HTC,DetectoRS 和 SCNet,你可以下载并解压它们到 `coco` 文件夹下。文件夹会是如下结构: | |
```text | |
mmdetection | |
├── data | |
│ ├── coco | |
│ │ ├── annotations | |
│ │ ├── train2017 | |
│ │ ├── val2017 | |
│ │ ├── test2017 | |
│ │ ├── stuffthingmaps | |
``` | |
PanopticFPN 等全景分割模型需要额外的 [COCO Panoptic](http://images.cocodataset.org/annotations/panoptic_annotations_trainval2017.zip) 数据集,你可以下载并解压它们到 `coco/annotations` 文件夹下。文件夹会是如下结构: | |
```text | |
mmdetection | |
├── data | |
│ ├── coco | |
│ │ ├── annotations | |
│ │ │ ├── panoptic_train2017.json | |
│ │ │ ├── panoptic_train2017 | |
│ │ │ ├── panoptic_val2017.json | |
│ │ │ ├── panoptic_val2017 | |
│ │ ├── train2017 | |
│ │ ├── val2017 | |
│ │ ├── test2017 | |
``` | |
Cityscape 数据集的标注格式需要转换,以与 COCO 数据集标注格式保持一致,使用 `tools/dataset_converters/cityscapes.py` 来完成转换: | |
```shell | |
pip install cityscapesscripts | |
python tools/dataset_converters/cityscapes.py \ | |
./data/cityscapes \ | |
--nproc 8 \ | |
--out-dir ./data/cityscapes/annotations | |
``` | |