为什么要进行maxpool?
max pooling之后,仅保留了最代表性的pixel
浅层网络输出:
深层网络输出:
图1虽然人容易看,但特征不具有代表性,就是说不能通过一个特征就判定它是否是行人,之所以人看起来容易,是因为人做了后面深层网络做的东西。
图2比较难以区分,因为它已经对某些结构进行了高层的抽象,很具有判别力,用简单的分类,比如阈值就可以做出最后的判定。
首先粗粒度提取一些特征,然后细粒度提取一些特征, 最后提取一些高级特征,用这些高级特征去做分类等。
全局特征是指图像的整体属性,常见的全局特征包括颜色特征、纹理特征和形状特征,比如强度直方图等。由于是像素级的低层可视特征,因此,全局特征具有良好的不变性、计算简单、表示直观等特点,但特征维数高
局部特征则是从图像局部区域中抽取的特征,包括边缘、角点、线、曲线和特别属性的区域等。常见的局部特征包括角点类和区域类两大类描述方式。局部图像特征具有在图像中蕴含数量丰富 ,特征间相关度小,遮挡情况下不会因为部分特征的消失而影响其他特征的检测和匹配等特点。