• 机器学习笔记3向量参数+feature scaling and mean normalization


    多特征变量的处理:依旧是一维的,是向量的积,并且是从0开始的X(x0,x1,...,xn),此处x0=1,为了配合f(x0,...,xn)=d0*x0+d1*x1+...+dn*xn;显然就是D点乘X。这对应之前的拟合公式,但显然是多维的,不过想象成2维就够了。每一个数据组合是一个x向量加它对应的y值,一共有m个数据组合,而x向量的维数假设是n。

    所以有了关于整体方差函数的公式:1/2m*{[f(x0(1),..,xn(1))]^2-y1(x0,..,xn)+[f()-y2()]^2+...}也就是说自变量是一组向量。我觉得自己分开写能更容易理解。

    下面说下处理的技巧:

    首先是数值的放缩,尽量乘以一个系数使x向量中的元素取值范围在-1~1之间。比方说房子的大小10000平最大,那么乘以0.0001即可。另外还有平移操作,也就是x-p,比方原始是1~5那么就减去3变成-2~2,再除以2变成-1~1。这些其实都是对方差函数图像进行均匀操作,使其能够对称均匀,从而更快得到最后的平静。所以就有某个元素(x-p)*j.其实就是做一个变量代换。所以不影响结果。但是他的幻灯片是先找到系数,再找位移,这就导致了1~5个卧室,定下系数5,再定下位移2。并且定义位移是平均值,我不知道是指的中位数还是平均值,系数是指的范围,比方5-1.不过他说最后大概这个范围就可以,5还是4都可以。

    这就是feature scaling 和mean normalization.

    本博客专注于错误锦集,在作死的边缘试探
  • 相关阅读:
    标准库中的生成器函数
    Python 数据分析5
    Chrome 开发者工具(三)------ Sources
    Chrome 开发者工具(二)------ Console
    Chrome 开发者工具 F12(一)
    jquery 获取自定义属性的值 data-*
    PHP 常用函数备忘
    Winsows 服务器,PHP 开发环境搭建
    FuelPHP 查看 Query SQL
    Laravel —— could not find driver
  • 原文地址:https://www.cnblogs.com/SweetBeens/p/6655674.html
Copyright © 2020-2023  润新知