基础内容

文档http://keras.io

使用GPU加速模型训练：

1）选择合适的代价函数loss：MSE （Mean Squared Error）均方误差，Cross Entropy交叉熵。当输出层为softmax层时，选择交叉熵代价函数更为科学。

2）设置合理的batch size（每次批处理训练样本个数）：所有的训练样本分出batch size个mini-batch用于训练，所有的mini-batch都训练完一次以后，记为完成了一个epoch。

使用mini-batch会使得loss可能会停留在局部极小值，但多完成几次epoch，这个问题就解决了；使用mini-batch会使得模型精确度提升。

3）选择合适的active function（激活函数）：Sigmod函数，ReLU（Rectified Linear Unit ）函数和maxout函数。

采用RelU激活函数可以解决梯度消失问题。

ReLU及其变体：

maxout最大值激活函数：

4）选择合适的learning rate（学习率）：如果学习率（梯度下降的步长）过大，则每次更新模型以后，loss可能不减小；如果学习率过小，则训练过程会太漫长。

adaptive learning rate自适应学习率：

相关阅读:
C#之反射
关系数据库中的函数依赖
关系型数据库中关系的完整性
sql的自连接
sql中的union和union all查询
c# 泛型之约束
c#之泛型
PTA 乙级 1009 说反话（20分） C/C++、Python
PTA 乙级 1008 数组元素循环右移问题 (20分) C、C++
PTA 乙级 1007 素数对猜想 (20分) C/C++

原文地址：https://www.cnblogs.com/defe-learn/p/10350642.html