global_step

global_step=tf.Variable(0, trainable=False)

设定trainable=False 可以防止该变量被数据流图的 GraphKeys.TRAINABLE_VARIABLES 收集, 这样我们就不会在训练的时候尝试更新它的值。

train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,global_step=global_steps)

因为指数衰减的学习率是伴随global_step的变化而衰减的，所以当global_step不改变时，学习率也变成一个定值。

综上所述：损失函数优化器的minimize()中global_step=global_steps能够提供global_step自动加一的操作。

这里有个额外的疑虑说明：global_steps是等号右边，在编程语言里面通常当作定值（即不会受函数影响）赋值给等号左边的global_step。然而，在这个优化器里面能够使得右边的变量自动加一。这确实是编程语言里面少见的，也是需要特别注意的。

相关阅读:
洛谷7月月赛 B 题解
undone
树剖学习
关于两周后noip---小计划
线段树技巧练习--GSS1
链式前向星存图及注意要点
错题集合
树上差分问题
2020暑假学习内容整理及后续计划
安利大佬博客

原文地址：https://www.cnblogs.com/pacino12134/p/9995883.html