1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下)
防止过拟合:
(1)进行特征选择,消除关联性大的特征
(2)加大样本量
(3)交叉验证(让所有数据都有过训练)
(4)正则化
正则化可以防止过拟合的原因:
L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。
L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。
2.用logiftic回归来进行实践操作,数据不限。
用逻辑回归预测空气质量。