【1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?】
逻辑回归是用回归的方式进行分类,拟合的不是线性函数,而是一个概率学中的函数,f(x)的值反映了样本属于这个类的概率。即训练结果原本为连续型变量,再通过划分阈值进行分类。
线性回归则是用线性的关系来拟合一个事情的发生规律,找到这个规律的表达公式,将得到的数据带入公式得到离散型变量预测结果,即为回归。
【2.自述一下什么是过拟合和欠拟合?】
· 过拟合 所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳。
过拟合就是学到了很多没必要的特征,就像人们产生的错觉,是由于算法开始推断不存在于数据集的模式而产生的;
· 欠拟合 可能训练样本被提取的特征比较少,导致训练出来的模型不能很好地匹配,表现得很差,甚至样本本身都无法高效的识别。
欠拟合更像学习障碍,阻止人们获取相关知识去完成既定任务。
【3.思考一下逻辑回归的应用场景有哪些?】
(1)在社交网络上进行汽车销售的推荐顾客是否购买
(2)根据肿瘤的特征判断肿瘤是否恶性
……
参考:欠拟合与过拟合