监督学习
在监督式学习中,我们得到了一个数据集,并且已经知道我们的正确输出应该是什么样子,并且认为输入和输出之间存在关系。
监督学习问题分为“回归”和“分类”问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们试图预测离散输出中的结果。换句话说,我们试图将输入变量映射到离散类别。
例1:
给定有关房地产市场上房屋大小的数据,尝试预测其价格。作为尺寸函数的价格是连续的输出,所以这是一个回归问题。
我们可以把这个例子变成一个分类问题,而不是让我们的输出关于房子是“卖出多少还是低于要价”。在这里,我们将基于价格的房屋分为两类。
例2:
(a)回归 - 给定一个人的照片,我们必须根据给定的图片来预测他们的年龄
(b)分类 - 给予患有肿瘤的患者,我们必须预测肿瘤是恶性的还是良性的。