机器学习十讲-第二讲回归

用一个或多个自变量来预测因变量的数学方法

在机器学习中，回归指的是一类预测变量为连续值的有监督学习方法

在回归模型中，需要预测的变量叫做因变量，用来解释因变量变化的变量叫做自变量。

最小二乘的参数估计为 $ widehat{w}=(X^TX){-1}X^Ty$ ，如果变量之间存在较强的共线性，则(X^{T}X)近似奇异，对参数的估计变得不准确，造成过度拟合现象。
解决方法︰正则化、主成分回归、偏最小二乘回归

当模型的变量过多时，线性回归可能会出现过度拟合问题

值得注意的是，当 (q=2) 时，为岭回归，当 $ q=1 $时，为 (LASSO)

当不断增大正则化参数入，估计参数(hat{w}^{ridge}(lambda))（也称岭回归系数）在坐标系上的变化曲线称为岭迹。岭迹波动很大，说明该变量有共线性。

LASSO

LASSO与岭回归

其中 (y_i) 为真实值，(ar{x}) 为真实值的平均值，(hat{y}_i) 为模型估计值

THE END

相关阅读:
SpringBoot与quartz集成
SpringBoot 中使用 @Valid 注解 + Exception 全局处理器优雅处理参数验证
搭建Redis集群和MySQL主从同步
scanf_s读取键盘输入字符串失败
含有通配符*的字符匹配（C语言）
人之患
TCP socket编程记录（C语言）
程序变量命名规范（个人）
h lib dll文件相关部分
关于inet_ntop、inet_pton中的n和p分别代表的意义

原文地址：https://www.cnblogs.com/xp-thebest/p/14394532.html