前言
以下内容是个人学习之后的感悟,转载请注明出处~
正规方程法
一、函数参数向量化
在计算机中,我们需要用同样的算法计算大量数据样本时,一般有两种方式:循环、参数向量化。
循环~,可想而知,计算量不是一般的大,不建议。
参数向量化的效率就高多了,把全部样本转换为向量,一次执行就搞定了。具体向量化方法,如下图所示,以线性回归
方程hθ(x)=θ0+θ1x1为例,最终转换为θ的等价公式,为正规方程法做好准备。
(注:X为样本矩阵,每一行为特征向量x的转置)
看到这里,相信很多童鞋的内心是崩溃的,上面这个公式是怎么来的,你倒是讲清楚啊~
推导过程如下:
1、这是4个样本的特征向量,每个样本的输出值hθ(x)=θTx。
2、特征向量组合成样本矩阵X
3、输出值向量y=Xθ(学过矩阵论的童鞋都能看得出来这是怎么来的,我就不多说了)
二、正规方程法
直接根据上图中的θ等价公式,采用所给样本,进行矩阵运算即可。
注意:由于矩阵的特殊性,以下三点需要谨慎对待。
- 矩阵(XTX)不可逆
原因1:所求参数大于样本数。
措施 :增加样本数。
原因2:特征值太多。
措施 :删除一些冗余的特征值。
- 样本量n太大
矩阵求逆的计算复杂度为O(n3),当样本量太大时,计算量过大,此时,不建议采用正规方程法。
- 函数太复杂
此时无法使用正规方程法。
以上是全部内容,如果有什么地方不对,请在下面留言,谢谢~