有监督学习的一般流程:
过拟合问题:所选模型对已知数据预测得很好,但对未知数据预测很差。
模型选择的方法:
①正则化:把对已知数据的训练误差和模型复杂度降到最小。
②交叉验证,数据比较少时,将数据集随机切分,组合为训练集和测试集。
Scikit-learn
有监督学习的一般流程:
过拟合问题:所选模型对已知数据预测得很好,但对未知数据预测很差。
模型选择的方法:
①正则化:把对已知数据的训练误差和模型复杂度降到最小。
②交叉验证,数据比较少时,将数据集随机切分,组合为训练集和测试集。
Scikit-learn