1.真正的定义:
注意这里面是+号不是减号.
2.对于rgb图像的处理
http://cs231n.github.io/assets/conv-demo/index.html
这个动态图真心赞.
总结一下:
首先我们只讨论w0,bo这个filter也就是过滤器,输入是3个矩阵,所以过滤器也是3个矩阵,bias为了方便就是一个常数,他表示的其实是这个常数*In矩阵
1.首先为了都采样到所以扩了一圈.
2.做卷积然后加b,得到的是3个矩阵,然后这3个矩阵做hadmard求和.
这里面为什么求和呢,因为对于具体问题虽然是rgb,但是我们分析要把他归结成一个矩阵,只用黑白色的矩阵来描述就够了,所以求和即可直接用这个黑白的.
就得到了最后的一个3*3矩阵.然后加bias就得到了最后的矩阵
所以rgb最后输出的是一个3*3*2的张量
●池化的2重方法:
说白了就是矩阵的进一步压缩,一般用max 和average两种方法进行池化.