Machine Learning 机器学习 分类
- Classification (分类)
- Regression (回归)
- Clustering (聚类)
- Dimensionality reduction (降维)
Supervised Learning 监督学习
已有样本数据(TrainingSet)包括输入(Input)和输出(Output),使用样本数据训练(Train)模型函数(Model),最后把未知输入(UnknownInput)带入模型函数,预测(Predict)输出(Output)
监督学习过程如下:
TrainingSet(Input & Output) -> Train -> Model -> Predict(UnknownInput -> Output)
即训练集(包含输入和输出)-> 训练 -> 模型 -> 预测(未知输入-> 输出)
一 Classification
分类属于监督学习,分类问题解决的是给定一个样本,预测变量是离散的,比如内容类别预测中,给定一个内容,需要预测出类别:体育、社会、财经等;
二 Regression
回归属于监督学习,回归问题解决的是给定一个样本,预测变量是连续的,比如股价预测中,给定一天的价格等信息,需要预测第二天的价格;
三 Clustering
聚类不属于监督学习,聚类问题解决的是给定一组样本,预测哪些样本之间离的更近,哪些样本之间离的更远,比如用户分群中,根据类别的定义,比如兴趣、购买力等,来将用户划分到多个类别中;