1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,是一个专门解决二分类的分类算法。逻辑回归使用一个函数来归一化y值,使y的取值在区间(0,1)内,这个函数称为Logistic函数(logistic function),也称为Sigmoid函数(sigmoid function)。
sigmoid函数的实现:
区别:①逻辑回归是一个分类算法,线性回归是回归算法;
②逻辑回归与线性回归都是一种广义线性模型,输入都是一样的,但逻辑回归的结果是一个二分类问题。
③逻辑回归只能使用梯度下降,线性回归可以使用均方误差和梯度下降。
2.自述一下什么是过拟合和欠拟合?
欠拟合:当模型复杂度很低时,测试误差和训练误差的损失值很高,这就是欠拟合。比如说你丢给计算机一些天鹅的属性让他预测,由于给的数据样本太少,所以计算机也可能会把鸭子认为天鹅,这便是欠拟合。
过拟合:当模型复杂度很高时,训练误差值很低,测试误差值很高,这就是给过拟合。比如你丢给足够的数据样本给计算机测试是不是天鹅,但是由于数据样本都是白天鹅,所以计算机会认为,白天鹅不是天鹅,这便是过拟合。
3.思考一下逻辑回归的应用场景有哪些?
(1)广告点击率;(2)是否为垃圾邮件;
(3)是否患病;(4)金融诈骗;(5)虚假账号