总结
这篇文章在person search end-to-end的开山之作E2E-PS的基础上,沿用faster rcnn框架并加以改进,在两个数据集(CUHK-SYSU和PRW)上都有较大改进。
contribution
论文框架如上图,基本沿用faster rcnn的框架,改进点主要有几个:
- 用ResNet代替VGGnet做特征提取
- 增加了一个center loss,使得网络减小类内差异的能力提升
- 作者认为,利用softmax可以更好的增加网络对类间差异的判断能力,而Siamese Network或者Triplet Network的contrastive loss或者triplet loss可以更好的提升类间compactiveness。所以增加一个center loss可以提升网络的判别能力。
- 舍弃了dropout
- 作者在实践中发现dropout与center loss不兼容,原因是dropout随机舍弃掉神经元,使得每次前向计算的特征都会有所不同,这使得类间的变化增大。而center loss是为了减小类间变化
center loss
center loss的定义如下图,其中是每个类的特征中心,由于对整个训练集的特征按类计算中心不可行,作者采用对每个mini-batch进行中心更新和最小化特征到对应类中心距离的方式进行,即:
整个网络的loss就包含5个子loss,即4个fasterRCNN原本的loss和一个center loss
实验结果
CUHK-SYSU 数据集
PRW数据集