1.神经网络介绍
2.MCTS介绍
3.AlphaGo zero执行过程(伪代码)
参考文章链接:https://blog.csdn.net/hhy_csdn/article/details/86759692
一、AlphaGo
1、事件
2016年初,AlphaGo战胜李世石,核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果。
2、主要机制
两个神经网络:策略网和评价网络
1.神经网络介绍
2.MCTS介绍
3.AlphaGo zero执行过程(伪代码)
参考文章链接:https://blog.csdn.net/hhy_csdn/article/details/86759692
一、AlphaGo
1、事件
2016年初,AlphaGo战胜李世石,核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果。
2、主要机制
两个神经网络:策略网和评价网络