分类:
目前机器学习主流分为:监督学习,无监督学习,半监督学习,强化学习。
1、监督学习:
监督学习可分为“回归”和“分类”问题。
在回归问题中,我们会预测一个连续值。也就是说我们试图将输入变量和输出用一个连续函数对应起来;而在分类问题中,我们会预测一个离散值,我们试图将输入变量与离散的类别对应起来。
监督学习最大的特点是:每个数据点都会获得标注,如类别标签或与数值相关的标签。一个类别标签的例子:将图片分类为「苹果」或「橘子」;数值标签的例子如:预测一套二手房的售价。监督学习的目的是通过学习许多有标签的样本,然后对新的数据做出预测。例如,准确识别新照片上的水果(分类)或者预测二手房的售价(回归)。
2、无监督学习:
在无监督学习中,我们基本上不知道结果会是什么样子,但我们可以通过聚类的方式从数据中提取一个特殊的结构。
无监督学习最大的特点是:数据没有标签。无监督学习算法的目标是以某种方式组织数据,然后找出数据中的内在结构。包括将数据进行聚类,或者找到更简单的方式处理复杂数据,使数据看起来更简单。
3、半监督学习:
半监督学习中,有些数据是有标签的,有些数据是没有标签的,因为实际中缺乏的不是数据,而是带标签的数据,给收集的数据进行标签代价是比较高的。
4、强化学习:
强化学习是一种学习模型,它并不会直接给你解决方案,而是让机器通过试错去找到解决方案。我们熟知的Alphago用的就是强化学习。
强化学习不需要带标签,你选择的行动越好,你得到 的反馈就越多,所以能通过执行这些行动看是输是赢来学习下围棋,不需要有人告诉你哪些行动是好的,哪些是坏的,属于完全自主性学习。
强化学习的特点:能自动进行决策,并进行连续的决策。
总结:目前用到最多的是监督学习和非监督学习,尤其是监督学习,因为应用场景能给公司创造直接价值。
但强化学习是未来,因为学习到的能力没有数据限制。