• 强化学习


    强化学习 (Reinforcement Learning),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

    算法

    (1)通过价值选行为

    • Q Learning
    • Sarsa
    • Deep Q Network

    (2)直接选行为

    • Police Gradients

    (3)想象环境并从中学习

    • Model based RL

    分类

    分类一

    • 不理解环境 Model-Free RL
    • 理解环境 Model-Based RL

    分类二

    • 基于概率(Police-Based RL)
    • 基于价值(Value-Based RL)

    分类三

    • 回合更新(Monte-Carlo update)
    • 单步更新(Temporal-Difference update)

    分类四

    • 在线学习(On-Police)
    • 离线学习(Off-Police)
    博客内容用于记录自己学习后的收获,如有侵权请联系我删除
  • 相关阅读:
    Dom修改元素样式
    URL百分号编码
    accesskey附上一些实例
    dom实例
    dom 创建时间
    关系运算符
    赋值运算符
    js图片随机切换
    js自增图片切换
    transform-origin盒子旋转位置
  • 原文地址:https://www.cnblogs.com/ptxiaochen/p/13602210.html
Copyright © 2020-2023  润新知