PS:以下内容来自慕课网,图片是视频截图。
一、什么是机器学习
利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。
二、机器学习与数据分析的区别
三、典型应用
四、分类
五、常用算法
六、noSQL处理行为数据
七、解决问题一般框架
八、补充说明
1 机器学习就是 :
把一个实际的问题抽象成一个多元高次方程 , 然后通过已知的历史数据来求解这个方程 .
求解的过程就是训练的过程 , 也就是机器学习的过程 .
2 主体是机器而不是人,异于数据分析;客体是数据,数据越多,越准确;结果是规律,最后落地的是规律
3、在具体项目中,特征工程(数据预处理,如数据清洗)占比大约在百分之70。数据的质量决定上界,特征工程类似于专家的经验,决定能多么逼近上界。
4、训练模型
(1)定义模型:确定模型,训练出模型的参数
(2)定义损失函数(定义偏差的大小):评价真实结果与模型的预测结果的相似程度和差异度。 机器学习解决的问题,有时不能得到精确解只能寻找近似解。 偏差最小的函数,针对很大的数据集,就是损失函数。 让损失函数求最小,就是优化算法。对于线性回归模型,计算预测结果与实际结果的差值;对于分类模型,则需要定义自己的损失函数
(3)优化算法:对算法进行优化,使损失函数取极小值,如梯度下降法......
机器学习解决问题的途径往往最终就落在了一个求函数的极小值的优化问题上。