AlphaGo、AlphaGo zero、Alpha zero - 润新知

AlphaGo、AlphaGo zero、Alpha zero

1.神经网络介绍

2.MCTS介绍

3.AlphaGo zero执行过程（伪代码）

参考文章链接：https://blog.csdn.net/hhy_csdn/article/details/86759692

一、AlphaGo

1、事件

2016年初，AlphaGo战胜李世石，核心技术深度强化学习受到人们的广泛关注和研究，取得了丰硕的理论和应用成果。

2、主要机制

两个神经网络：策略网和评价网络
相关阅读:
多层装饰器执行顺序
 flask之中间件蓝图 falsk请求上下文 rquirements.txt threading.local 偏函数
 flask 之在flask中使用websocket
flask 之项目分文件使用sqlalchemy+flask-migrate djagno多数据库
 flask之六 sqlachemy详解 scoped_session线程安全基本增删改查多对多关系建立和操作 flask-sqlalchemy的使用
 远程连接linux开发项目
 INT104-lab9
INT104-lab8
INT104-lab7
Java-数据结构-泛型BST-CPT102-tutorial Week6
原文地址：https://www.cnblogs.com/qianwangxingfu/p/11603909.html

Copyright © 2020-2023 润新知