1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归与线性回归输入都是一样的,但是逻辑回归在输入完成后会利用 sigmoid 函数进行处理映射到0和1之间,而0和1使我们的分类问题,所以逻辑回归是一个专门处理二分类问题的算法;总的来说他们之间的不同点在于着重点的不同,线性回归偏向于预测,逻辑回归偏向于分类。
2.自述一下什么是过拟合和欠拟合?
在模型复杂度较低的时候,测试误差以及训练误差都比较大,这种情况我们称之为欠拟合。它的出现是由于模型中给定的特征太少,我们举个例子来理解一下:当我们要辨别苹果,我们给的特征只有两种:圆的、红的。那么当我们测试和训练的时候只要是圆的红的,我们的机器都会把它辨别为苹果,那么这时候的误差就会变得很大,出现的这种情况就是欠拟合;
在模型复杂度较高的时候,测试误差比较大,训练误差则比较小,这种情况我们称之为过拟。它的出现是由于模型中给定的特征太多太杂,我们举个例子来理解一下:还是辨别苹果,这次我们给的特征很多:圆的、红的、青的、尺寸大小、表面光滑。当我们进行训练的时候误差可以到达很少的程度,但是我们测试的时候误差还是会很大(例如:我们拿一个青红相间的苹果去测试),出现这种情况就是过拟合;
总体上如下图所示:
更具体一点的图:
第一个二维图是欠拟合,第二个是刚刚好,第三个是过拟合。
3.思考一下逻辑回归的应用场景有哪些?
1)新闻数据集分类
2)预测癌症死亡率
3)企业上预测客户信用是否正常
4)判断一张图片中的物体是不是苹果