slides见 http://cs231n.stanford.edu/2017/syllabus.html
1. 回顾全连接层
2. 卷积层: 能maintain数据的空间结构
1) fileterW在做点积的时候,5*5*3 被flatten 成 75*1 ,然后点积得到一个值
两个向量a = [a1, a2,…, an]和b = [b1, b2,…, bn]的点积定义为:
a·b=a1b1+a2b2+……+anbn
图二是filter的移动和映射
*注意: 生成的output 叫做 activation map
2) 步长(stride)与output_size的对应
3)0 padding
以上我们可以看出 输入尺寸为7*7*3的图片经过 filtter之后,输出的尺寸变小了->5*5*3,如果想要维持原尺寸,可以加 padding
没有Padding 尺寸会变小的非常快,如下
4) ConvNets 的步骤
5)问题:
(1) (N + 2padding - fileter) / stride + 1 :
(32+2*2-5)/1 + 1 = 32
(2) 上题中,有多少参数: (5*5*3+1)*10 = 760 加的1是 Bias
6)
在一次或几次卷积之后,宽度就不是3, 此时filter宽度(1*1*64)与上一层 filter 数量相同(64个 5*5*3)