VOC标准数据集中一共有20个类别:
'aeroplane', 'bicycle', 'bird', 'boat',
'bottle', 'bus', 'car', 'cat', 'chair',
'cow', 'diningtable', 'dog', 'horse',
'motorbike', 'person', 'pottedplant',
'sheep', 'sofa', 'train', 'tvmonitor'
可以尝试用其中的红色标注的五个类别来对隧道目标进行识别。
标准数据集中的车和行人的图像都很清晰,不能代表隧道中的复杂形势。
用faster R-CNN的VGG16网络模型对标准数据集和隧道数据集分别训练,比较训练后的准确率,观察是否用隧道数据集对网络进行训练比标准数据集要好。
Faster R-CNN+VGG16训练pascal VOC2007
./experiments/scripts/faster_rcnn_end2end.sh 0 VGG16 pascal_voc
Faster R-CNN+VGG16训练隧道数据集