所谓的多元,通俗一点讲就是一个数据集中含有多个特征,一元的话就含有一个特征,因此公式变为
假设
(h_{ heta}(x)= heta_{0}+ heta_{1} x_{1}+ heta_{2} x_{2}+cdots+ heta_{n} x_{n})
参数:未知
( heta_{0}, heta_{1}, ldots, heta_{n})
损失函数
(Jleft( heta_{0}, heta_{1}, ldots, heta_{n} ight)=frac{1}{2 m} sum_{i=1}^{m}left(h_{ heta}left(x^{(i)} ight)-y^{(i)} ight)^{2})
梯度下降算法
Gradient descent:
Repeat { (
ightarrow heta_{j}:= heta_{j}-alpha frac{partial}{partial heta_{j}} Jleft( heta_{0}, ldots, heta_{n}
ight))
(simultaneously update for every (j=0, ldots, n) )
一般来讲梯度下降算法是适用于大样本的,大样本多大呢?10000+吧
以上线性回归的预测是连续值的情况下
适用场景
房价
人口等预测
当然了具体的建模具体分析
补充代码: