常见机器学习模型总结

一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。

　　　　1）分类：线性分类器（如LR)、支持向量机（SVM）、朴素贝叶斯（NB）、K近邻（KNN）、决策树（DT）、集成模型（RF/GDBT等）

　　　　2）回归：线性回归、支持向量机（SVM）、K近邻（KNN）、回归树（DT）、集成模型（ExtraTrees/RF/GDBT）

数据聚类（K-means）/ 数据降维（PCA）等等.

　　1-各个模型分别基于哪些数学假设、适合处理什么样的数据、优缺点、评测指标及其计算方法

模型名称	数学假设	模型优缺点	评测指标及其计算方法
LR	假设特征与分类结果存在线性关系使用sigmoid函数映射到0-1	与随机梯度上升算法相比，预测精度准确，但是耗费时间长	准确性（Accuracy）召回率（Recall）精确率（Precision）以及F1
NB	各个维度上的特征被分类的条件概率之间是相互独立的、贝叶斯公式	广泛用于文本分类优点：速度快，参数估计的个数锐减缺点：在特征关联性较强的任务性能差	同上
集成模型	训练多个模型 RF---bagging GDBT----boosting 模型融合相关内容	优点：性能高、稳定性强、广泛应用于工业界缺点：训练时间长，调参是体力活 xgb、lightGBM是比较快的	同上
回归相关的模型	SVM有三种核函数（linear/poly/rbf）		R^2/MAE/MSE/RMSE

相关阅读:
基本处理函数（ProcessFunction）
按键分区处理函数（KeyedProcessFunction）
Flink 分流
处理函数应用案例——TopN
处理迟到数据
hive 字段注释中文乱码
Centos 关闭防火墙
窗口处理函数
hive posexplode 函数的使用举例
框架——容器框架——spring_boot——actuator

原文地址：https://www.cnblogs.com/xiaofengzai/p/14529748.html