The categories of Reinforcement Learning 强化学习分类 - 润新知

The categories of Reinforcement Learning 强化学习分类

RL分为三大类：

（1）通过行为的价值来选取特定行为的方法,具体包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network；

（2）直接输出行为的 policy gradients；

（3）了解所处的环境, 想象出一个虚拟的环境并从虚拟的环境中学习。

另一种分类方式：

Model-free and Model-based

Model-free：不理解环境
相关阅读:
经典解析23 种设计模式
 如何用手机赚钱——admob
解决solaris zfs文件系统内存占用过高
 在运行suncluster的数据库服务器上遇到oracle故障的解决办法
 对oracle用户进行资源限制
 Linux下TortoiseGit 配置管理环境搭建
 Linux系统非root帐号执行ssh发生Segmentation fault错误
 Solaris的panic故障分析
 转: Linux下单网卡多vlan多虚拟机
 oracle故障快速定位
原文地址：https://www.cnblogs.com/ghllfl/p/8383852.html

Copyright © 2020-2023 润新知