1、线性模型
形式简单、易于建模、很好的可解释性
2、逻辑回归
无需事先假设数据分布;
可得到近似概率预测;
对率函数任意阶可导的凸函数,许多数值优化算法都可直接用于求取最优解
3、线性判别分析(LDA)
当两类数据同先验、满足高斯分布且协方差相等时,LDA可达到最优分类
4、boosting
代表adaboost:只适用于二分类
5、bagging
在易受样本扰动的学习器上效用更明显(如不剪枝决策树、神经网络)
6、随机森林
简单、容易实现、计算开销小、泛化性能较bagging进一步提升(基学习器多样性不仅来自样本扰动,还来自属性扰动)
起始性能相对较差,但随着个体学习器数目的增加,通常会收敛到更低的泛化误差