【Machine Learning】机器学习概述

机器学习定义

　　机器程序从经验E中学习，解决某一任务T，进行某一性能度量P，通过P测定程序在T上的表现因经验E而提高。

学习算法分类

监督学习
无监督学习
强化学习

1.监督学习

　　所谓监督学习，就是先利用有标签的训练数据学习得到一个模型，然后使用这个模型对新样本进行预测。在本质上，监督学习的目标在于，构建一个由输入到输出的映射，该映射用模型来表示。

2.无监督学习

　　无监督学习又称无导师学习，是指在没有任何标识的情况下进行分类。既无监督学习不需要样本数据，可以直接建立模型将数据聚类。对于未分类的事物，机器会根据自己的判断将物品根据一定的

特征归类。

3.强化学习

　　强化学习主要由智能体（Agent）、环境（Environment）、状态（State）、动作（Action）、奖励（Reward）组成。智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信号（正奖励或者负奖励）。随后，智能体根据新的状态和环境反馈的奖励，按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。智能体通过强化学习，可以知道自己在什么状态下，应该采取什么样的动作使得自身获得最大奖励。由于智能体与环境的交互方式与人类与环境的交互方式类似，可以认为强化学习是一套通用的学习框架，可用来解决通用人工智能的问题。因此强化学习也被称为通用人工智能的机器学习方法。

相关阅读:
golang通知协程退出
Linux Centos7下安装Elasticsearch
es
Laravel 别名 Facades的用法
SVN使用时遇到的小问题
http 重定向到 https
Git-版本回退
selenium---上传文件（非input标签）
selenium---生成BeautifulReport报告
windows搭建ngnix图片服务器

原文地址：https://www.cnblogs.com/AirCL/p/16396942.html