机器学习介绍
什么是机器学习
机器学习的实质是找到一个函数,当给定输入时,期望这个函数能给出正确的输出。
因此机器学习可大致分为三步:定义模型(函数集合),确定评判模型好坏的函数,找到最优的模型。
机器学习的分类
根据训练集的特点和模型训练的方式,大致可分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning) 和强化学习(Reinforcement Learning).
在应用中需要根据实际问题的类型和数据集的特点去选择相应的机器学习方法和模型。
监督学习
特点:训练集是有标签的,如在图片分类问题中,训练集中的每一张图片都预先被标记了正确的分类标签。
无监督学习
特点:训练集是没有标签的,一般用于聚类分析。如给定客户各个维度的数据,对客户进行分类(事先不知道分为几类和类别的特点)。
强化学习
特点:可以不用训练集,而只给出学习和奖励的规则。往往需要模型做出一系列连续的判断或输出,根据最后的结果给予反馈。如在围棋训练中,只给出下棋和正负判断的规则,只将最后胜负结果反馈给机器学习系统。