一、监督学习
监督学习的概念与数学形式
统计机器学习的三要素
- 统计学习方法: 模型+策略+算法
监督学习的三个问题
- 分类、回归、标注
-
学习过程: 在假设空间执行搜索优化,挑选最好的学习器模型
预测过程: 使用训练好的学习器对未见过得新样本实例作出预测,推断其类别! -
学习器的评价指标:精确率、召回率
二、无监督学习
-
概念: 在无标记的数据上进行学习,重在发现数据中潜在的结构化信息,寻找数据的新视图。
-
主要方法:聚类分析、高斯混合模型、密度分布估计、协方差估计、流形学习
-
流形学习: 一种无监督的非线性的维数约简方法。它基于这样的认识:很多数据的维数只是人为地变高了。
-
维数约简的常见方法:随机投影、主成分分析(PCA)、线性判别分析(LDA)、局部线性嵌入(LLE)、t-SNE嵌入