keras学习（三）CNN处理mnist

这次是通过CNN来处理训练mnist数据集，CNN的结构是根据视频学的最简单的结构，在模型编译后使用model.summary()就可以将模型结构显示出来，如下图。也有另一种方法plot_model(model, to_file = 'model.png',show_shapes = True),这个显示出来的就比上一种好看，这个是直接输出图片，里面是一种有向图，很直接的将模型结构画出来了。

卷积——>池化——>卷积——>池化——>全连接——>全连接,就这么简单，不过在每个卷积和全连接层后有个激活函数层。
这次我想着把mnist里面究竟是什么东西搞清楚，所以就有了下面的代码：

def plot_x_y():
    (x_train, y_train), (x_test, y_test) = mnist.load_data()  # x:60000*28*28,y:60000
    # 可视化x_train
    for i in range(10):
        img = Image.fromarray(x_train[i]) #这个代码是将数组转成图片格式，理论上只要是数组形式的数据都可以#可视化。
                                          #因为颜色属性是在0-255之间，所以一般数组里面的值在0-255之间才有颜色显示，如果高于255
                                          #可视化的时候就采取255代替，也就是显示白色；反之小于0就是黑色。
        plt.imshow(img)
        plt.show()
    # 可视化一下y，然后我就没事干，想看一下y，但是因为原本的y是一个一维数组，里面有60000个0-9之间的数字，因此这个看起来没啥意思，
    #所以需要下面的代码将y处理成独热（one hot）标签。
    y_train = np_utils.to_categorical(y_train, num_classes=10)
    for i in range(10):
        if y_train[0][i] == 1: #啊，这一步，因为one hot里面只有0,1，他两颜色太接近，可视化看不出来，所以将 
                               #1变成255，这样显示就是白色，有明显对比了。
            y_train[0][i] = 255
    img = Image.fromarray(y_train[0])
    plt.imshow(img)
    plt.show()

x里面的图片显示出来就是下面这样子,只显示了前10张图片：

y可视出来了是这个样子，其实没啥看的，就是好玩，我把它横过来了，正常是竖着的：

然后就是正规工作了，代码如下：

import numpy as np
import pickle as p
from PIL import Image
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Activation, Convolution2D, MaxPooling2D, Dense, Flatten
from keras.utils import np_utils
from keras.optimizers import Adam
import matplotlib.pyplot as plt
import matplotlib.image as plimg

from keras.utils.vis_utils import plot_model as plt_


(x_train, y_train), (x_test, y_test) = mnist.load_data() #x:60000*28*28,y:60000

x_train = x_train.reshape(-1, 1, 28, 28)  #转成n个（1*28*28）的数据，1为高，
x_test = x_test.reshape(-1, 1, 28, 28) #
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)


#搭建模型
model = Sequential()
###第一层需要写入输入尺寸，后面的不需要，但是在全连接时要写输出层数，卷积层处理完后要加一个激活函数层
#卷积：  输入：1*28*28     输出：32*28*28
model.add(Convolution2D(filters=32,  #卷积核数目，也是输出通道数（高度）
                        kernel_size=(5, 5), #卷积核为5*5
                        padding='same',    #padding，确保长宽不变
                        input_shape=(1, 28, 28)  #输入
                        ))
model.add(Activation('relu'))
###池化通道数不变，长宽减半，卷积长宽不变，高度增加
#池化：  输入：32*28*28     输出：32*14*14
model.add(MaxPooling2D(pool_size=(2, 2),
                       strides=(2, 2),
                       padding='same',
                       ))
#卷积：  输入：32*14*14     输出：64*14*14
model.add(Convolution2D(filters=32,
                        kernel_size=(5, 5),
                        padding='same',
                        ))
model.add(Activation('relu'))
#池化：  输入：64*14*14     输出：64*7*7
model.add(MaxPooling2D(pool_size=(2, 2),
                       strides=(2, 2),
                       padding='same',
                       ))
#全连接：  输入：64*7*7=3136     输出：1024(自己设置)
model.add(Flatten()) #Flatten将64*7*7变成3136
model.add(Dense(1024))
model.add(Activation('relu'))

#全连接：  输入：1024     输出：10
model.add(Dense(10))
model.add(Activation('softmax'))

#编译模型，
adam = Adam(lr=0.0001) #优化器
model.compile(optimizer=adam, 
              loss='categorical_crossentropy',
              metrics=['accuracy'])

model.summary() #将模型结构输出
#训练
print("-------------------train--------------")
model.fit(x_train, y_train, epochs=2, batch_size=100) #因为总数据有60000个，所以batch_size就写100了。 
                                             #epochs设置1/2结果就挺可观了，不需要设置太大了

#测试
print("---------------------test--------------")
loss, accuracy = model.evaluate(x_test, y_test)
print(loss, accuracy)

下面是训练过程：

最后测试集的loss和准确度分别有0.17145和0.94919，结果还是挺高的

相关阅读:
关于unity的一个不错的插件平台
 erlang otp中的socket参数设置
 android开发国内镜像
 composer中文镜像
 bootstrap的一些资源
 根据现有表操作基于active record的model
Erlang Web 监控工具
 erlang程序发布的时候需要注意的地方
 pcl学习笔记（二）：点云类型
 c++中inline函数的意义
原文地址：https://www.cnblogs.com/hecong/p/13423737.html