• 论文阅读笔记(三十二)【ACM Multimedia 2018】:Learning Discriminative Features with Multiple Granularities for Person Re-Identification


    Introduction

    当前的part-based reid方法分为如下三类:

    ① 采用人体部件位置的先验知识或者姿态估计来定位部件区域(如把图片按若干个水平区域划分);

    ② 通过部件定位方法来识别部件;

    ③ 采用注意力机制来关注部件区域。

    作者提出了一个全局、局部不同粒度特征联合学习策略,即 Multiple Granularity Network(MGN),如下图:

    Multiple Granularity Network

    IDE baseline 提取出的行人特征映射图如下所示,可以发现即使没有采用注意力机制,深度神经网络依然能够提取出行人肢体的语义信息。

    (1)网络结构:

    三个网络分支的细节为:

    ① 上层分支为全局特征提取。先采用步长为2的下采样,紧接着全局最大池化得到特征映射,再进行1*1卷积、batch正则化、ReLU激活,把2048维的特征下降到256维的

    ② 中间分支和下层分支不采用下采样,区别在于中间分支将特征map划分为2块,下层分支将特征map划分为3块,分别对全局和局部进行池化。

    ③ 在测试阶段,所有的256维度的特征向量进行concat,得到最终的特征向量进行度量。

    (2)损失函数:

    ① softmax损失:

    其中对应的是第 k 类的权重,对于三层的局部特征和全局特征均计算softmax损失。

    ② 三元组损失:

    对于三层的全局特征计算三元组损失。

    Experiment

  • 相关阅读:
    C#方法重载 -0024
    C#表达式体方法 (expression-bodied method )
    C# 匿名类型 -0022
    C# 不可变类型 -0021
    C# 属性 -0020
    C# readonly和const -0019
    C# 类的静态成员和实例成员 -0018
    C#中类和结构体的区别 -0017
    C#预处理器指令 -0016
    微信小程序TabBar定义和配置
  • 原文地址:https://www.cnblogs.com/orangecyh/p/12625497.html
Copyright © 2020-2023  润新知