4.1 卷积神经网络
卷积神经网络主要应用于计算机视觉相关任务,但它能处理的任务并不局限于图像,在语音识别方面也是可以使用卷积神经网络
计算机可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级建构除更为抽象的概念,这是CNN(卷积神经网络)工作方式的大体概述。
CNN工作概述指的是选择一张图片,历经一系列卷积层、非线性层(激活函数)、池化层(下采样层)、全连接层,最终得到输出,可以是最好的秒数了图像内容的一个单独分类或一组分类的概率。
卷积完成的是对图像特征的提取或者信息匹配。当一个包含某些特征的图像经过一个卷积核的时候,一些卷积核被激活,输出特定信号。
例如,当我们训练区分猫狗的图像的时候,卷积核会被训练,训练的结果就是卷积核会对猫和狗不同特征敏感,输出不同的结果,从而达到了图像识别的目的。
图4-1
卷积层三个参数: tf.keras.layers.Conv2D()
1)ksize 卷积核的大小,一般是33 55 7*7
2)strides 卷积核移动的跨度,每次移动几个像素位置,大部分是1
3)padding 边缘填充 有边缘填充一般操作后的图像大小不变 默认为valid不填充
池化层
图4-2
在22中找到一个最大值代表这个22区域,作用降低了之后训练的计算量
这个是最大值池化,患有平均池化,取平均值,一般采用最大值池化
图4-3
卷积神经网络整体架构图如图4-3所示。
在进行卷积的时候,不是只有一个卷积核,会使用多个卷积核,这样就会让数据变厚,一个卷积核会生成一个特征卷积数据。