• 机器学习基础2--评价回归模型


    再次回到上一节的13次模型.

    这个疯狂的曲线造成了一种现象过拟合.

    很明显,你的房子不可能只值这么点价钱,所以看上去,这个13次模型甚至还不如一开始的二次模型.

    那么现在有个疑问,我们应该怎样去选择最合适的模型?

    我们想要准确预测,但是我们无法观测未来.

    下面我们模拟一次预测过程:

      1.我们随机将一些房子数据排除在外.

      2.然后拟合剩下的数据

      3.最后进行预测和推断.

    术语:

      训练集(training set):用来拟合模型的数据.

      测试集(test set):排除出去的数据.

    训练损失(training error):训练集上的损失,就是训练集上的残差平方和.

    测试损失(test error):测试集上的损失,就是测试集上的残差平方和.

     

    那么这两个ŵ会起到什么作用?

    我们以模型(线性模型,二次模型...十三次模型等)为X轴,损失为Y轴,绘制一个二维坐标系.

     

    训练损失在不断降低的同时,测试损失竟然在某个点开始升高了!


    在这个点找到了一个和你房子大小相近的房子,你准备以此为参照.

    但是你发现,这个房子只有一个卫生间,而你的房子是有3个的.

    很明显,这个房子无法作为参照使用.

    那么,我们把卫生间作为另一个特征,加入线性模型.

    X1为房屋面积,X2为卫生间数量,Y为价格.

    那么,另外一些特征呢?

      卧室的数量

      位置

      ...

    end


     课程:机器学习基础:案例研究(华盛顿大学)

     视频链接:https://www.coursera.org/learn/ml-foundations/home/welcome  

     week2 Evaluating regression models

  • 相关阅读:
    springboot访问项目中某个module的图片(服务器拿不到)
    ValidForm ajaxurl 进行表单验证检验用户名是否存在
    jrebel热部署配置
    form标签之form:checkboxes
    springboot 整合jsp过程中的一些问题
    springboot的一些配置
    mysql5.7解压版
    [转载][翻译] 利用JSF、SpringFramework和Hibernate构建Web应用的实例讲述
    获取本机MAC地址
    个人职业生涯讨论
  • 原文地址:https://www.cnblogs.com/redheat/p/9179257.html
Copyright © 2020-2023  润新知