有监督学习、无监督学习、强化学习比较 - 润新知

有监督学习、无监督学习、强化学习比较
有监督学习Supervised Learning：
- 从已经标记的样本中进行学习
- 可用于目标识别、分类
- 本身不适合交互环境，但是若用正确的行为(action)对场景(situation)进行标注，也可学习。
- 适用于标注难度不大，成本不高的情况。
无监督学习Unsupervised Learning：
- 从没有标记的样本中进行学习，以发现其中的结构
- 常用于聚类，标注不易的场景。
强化学习Reinforcement Learning：
- 其中没有监督者，只有一个reward信号
- 在与situation的交互中获取样例（训练样本）
- agent的行为会影响之后一系列的data
Deep Q-Network
- Q-Learning（强化学习的一种）与神经网络的结合，简称 DQN。
- 解决的问题难题：状态的数量过多，并且需要人工去设计特征，而且一旦特征设计不好，则得不到想要的结果。
- 用神经网络处理状态过多的问题，取代原来 Q 表的功能。
相关阅读:
备战noip week1
20200820校测
 UVA 11419 SAM I AM
需求沟通技巧
 ReentrantLock和ReentrantReadWriteLock对比
 线程池浅析
 常用设计模式之单例模式
 java开发3~5年工作经验面试题
 2019计划
 Linux系统安装Tomcat
原文地址：https://www.cnblogs.com/xbit/p/9690700.html

Copyright © 2020-2023 润新知