一、机器学习是什么
机器学习就是数据挖掘,找到一个模型。
二、机器的流程是什么
第一步:把数据预处理,比如降维这些
第二步:找到人设计的模型f,比如线性、决策树、贝叶斯、神经网络等等
第三步:把全部训练样本m,统计计算模型f和全部样本m的均方误差(也叫loss,E(f))。因为均方误差要到达最小,就要参数W最好。参考《西瓜书P54》
第四步:参数有无数个,不能参数不同均方误差。所以找到参数Parameter,就是要使用最小二乘法、梯度下降算法让。
第五步:对于训练样本就是均方误差最小,但是不能分辨正反啊。找到了模型f,就可对未来的数据分辨正反。所以设计一个错误率、精度、PR曲线、ROC曲线等。参考《西瓜书P30》
三、机器的边学边读
sklearn基础。https://blog.csdn.net/yuanshuaipeng/article/details/80399863