小鸟:https://github.com/yenchenlin/DeepLearningFlappyBird
五子棋:https://github.com/ArinoWang/AlphaZero_Gomoku-master
强化学习方法汇总
https://zhuanlan.zhihu.com/p/24806654
Q – LEARNLING:
一个 Q-learning 算法的简明教程
https://blog.csdn.net/itplus/article/details/9361915
DQN:
DQN 从入门到放弃1 DQN与增强学习
https://zhuanlan.zhihu.com/p/21262246?refer=intelligentunit
DQN 从入门到放弃2 增强学习与MDP
https://zhuanlan.zhihu.com/p/21292697?refer=intelligentunit
DQN 从入门到放弃3 价值函数与Bellman方程
https://zhuanlan.zhihu.com/p/21340755?refer=intelligentunit
DQN 从入门到放弃4 动态规划与Q-Learning
https://zhuanlan.zhihu.com/p/21378532?refer=intelligentunit
DQN从入门到放弃5 深度解读DQN算法
https://zhuanlan.zhihu.com/p/21421729?refer=intelligentunit
DQN从入门到放弃6 DQN的各种改进
https://zhuanlan.zhihu.com/p/21547911
DQN从入门到放弃7 连续控制DQN算法-NAF
https://zhuanlan.zhihu.com/p/21609472
MC
蒙特卡洛树搜索(MCTS)算法
https://blog.csdn.net/ljyt2/article/details/78332802
五子棋
https://zhuanlan.zhihu.com/p/32089487