机器学习定义
机器程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定程序在T上的表现因经验E而提高。
学习算法分类
- 监督学习
- 无监督学习
- 强化学习
1.监督学习
所谓监督学习,就是先利用有标签的训练数据学习得到一个模型,然后使用这个模型对新样本进行预测。在本质上,监督学习的目标在于,构建一个由输入到输出的映射,该映射用模型来表示。
2.无监督学习
无监督学习又称无导师学习,是指在没有任何标识的情况下进行分类。既无监督学习不需要样本数据,可以直接建立模型将数据聚类。对于未分类的事物 ,机器会根据自己的判断将物品根据一定的
特征归类。
3.强化学习
强化学习主要由智能体(Agent)、环境(Environment)、状态(State)、动作(Action)、奖励(Reward)组成。智能体执行了某个动作后,环境将会转换到一个新的状态,对于该新的状态环境会给出奖励信号(正奖励或者负奖励)。随后,智能体根据新的状态和环境反馈的奖励,按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。智能体通过强化学习,可以知道自己在什么状态下,应该采取什么样的动作使得自身获得最大奖励。由于智能体与环境的交互方式与人类与环境的交互方式类似,可以认为强化学习是一套通用的学习框架,可用来解决通用人工智能的问题。因此强化学习也被称为通用人工智能的机器学习方法。