1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性
明确机器学习的分类能够让我们对数据的处理更加得心应手,更加精确的使用适合的方法去处理数据,机器学习分为四大类,在每一类下面又有着处理不同形式的数据的方法,如下图所示:
在监督学习里面有回归以及分类两种算法,记住他们之间的区别在于输出变量的类型不同这点非常重要,这关系到我们是否能够正确的处理数据,以下就是他们之间的具体区别之处:
线性回归可以根据已有的数据来预测给定自变量的因变量的值,这能够起到很好的预测作用,而预测出来的数据能够给人一个参考的作用,以下就是线性回归的定义以及他的方程:
根据线性回归算法进行预测的数据有可能会与现实值存在一定的误差,这时候我们的损失函数就能够起到一定的修正作用了,以下就是损失函数的定义及公式:
下表是线性回归算法的策略的使用,以及优化的方式:
正规方程、梯度下降对比:
当我们要训练很多数据的时候,未经优化的线性回归算法所需要的时间是比较久的,那么这个时候我们就可以用上表提到的两种优化方式对算法进一步的优化,而梯度下降法相对来说更有效,下面就是梯度下降法的式子:
2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)
答:可以通过多年累计下来的降雨量的数据来预测最新一年的降雨量,还能够通过近几年环境污染的数据来预测最新一年的污染增长或者下降比等。
3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)