语义分割:将图片的每个像素按照类别区分开,缺点是无法区分同类别实例
语义分割的一些想法:
1.滑动窗口
将每一个小窗口通过cnn分类,缺点是计算量非常大
2.全卷积网络:
利用全是卷积层的网络来训练,通过填充保持图片的大小不变,最后分类得到语义分割后的图像,C为类别数量
在深通道(如64,128,256)逐层做卷积操作,非常消耗内存和计算量
3.先下采样再上采样
对一小部分卷积层做原清晰度处理,经过一系列下采样,卷积,不使用全连接
上采样(去池化):
最邻近去池化:将值赋给附近领域
钉床(Bed of Nails)去池化:将值赋给左上角元素,其余填充零
最大去池化(Max Unpooling):与Maxpooling相对应,将原值赋给对应位置元素,其余填充零
在网络的后半部分用去池化将相应元素放在池化前的相应位置,保存空间的上的结构,
(池化后在低清晰度保留的元素与填充后的小块组成高清晰度的图像,这样可以保证最大池化的元素依然是在相应的位置)
优点:分割的意义就在于找到不同类别的边界,最大池化后在低清晰度会丢失空间信息,去池化后会还原空间信息,帮助预测
转置卷积:
Q1:上采样有哪几种方法?
A1: 去池化、转置卷积、双线性插值
Q2:在草稿纸上绘图说明反卷积的过程。
Q3:(思考题)反卷积的步长会对上采样结果带来怎样的变化?
1