pycocotools ― COCO数据集专用,也可以通过 pip安装
【Mask R-CNN】(十二):代码理解coco.py
coco格式的数据集进行训练
labelme数据转成COCO数据
数据准备
在repo下创建一个数据文件夹,
cd {repo_root}
mkdir data
确保根据下面的文件结构将文件放置好:
coco
├―― 注释
| ├―― instances_minival2014.json
│ ├―― instances_train2014.json
│ ├―― instances_train2017.json
│ ├―― instances_val2014.json
│ ├―― instances_val2017.json
│ ├―― instances_valminusminival2014.json
│ ├―― person_keypoints_train2014.json
│ ├―― person_keypoints_train2017.json
│ ├―― person_keypoints_val2014.json
│ └―― person_keypoints_val2017.json
└―― 图片
├―― train2014
├―― train2017
├―― val2014
└―― val2017
下载instances_minival2014.json和instances_valminusminival2014.json的链接
随便将数据集放在任意想放的地方,然后将数据集软连接到data/ 文件夹下:
ln -s path/to/coco data/coco
推荐将图片输入SSD网络来使训练效果更加好。
根据我的经验来看, COCO2014针对相关的图片数据有一些不同尺寸(h,w)的掩码注释。可能 instances_minival2014.jsoninstances_valminusminival2014.json 包含了错误的掩码注释。然而COCO2017 数据集并没有这个问题.。据说 COCO train2017数据集 与 (COCO train 2014 + COCO minival 2014)相当 ,并且 COCO test 2017数据集 与COCO valminusminival 2014数据集相当。 因此,使用 COCO 2017 训练-验证切分集来重做结果是可以的。