线性回归一般模型:
y = w1 * x1 + w2 + x2 + ...+ w(n) * x(n) +b
对于多个特征的数据集而言,线性模型可以非常强大,如果特征数量大于训练数据点的数量,任何磨边y都可以在训练集上用线性函数完美拟合
线性回归又称 普通最小二乘法
线性回归寻找参数w和b,使得对训练集的预测值域与真实的回归目标值y之间的均方误差最小。均方误差是预测值与真实值之差的平方和除以样本数
训练集和测试值的性能差异过大是过拟合的明显标志
标准的线性回归最常用的替代方法之一就是岭回归