• 可决系数R^2和MSE,MAE,SMSE


    波士顿房价预测

    首先这个问题非常好:+1:
    其实要完整的回答这个问题很有难度,我也没有找到一个完整叙述这个东西的资料,所以下面主要是结合我自己的理解和一些资料谈一下r^2,mean square error 和 mean absolute error。可能不是很完整,供参考:grin:

    MSE


    这个应用应该是最广的,因为他能够求导,所以经常作为loss function。计算的结果就是你的预测值和真实值的差距的平方和。

    MAE


    这个用的不是上面的平方项了,而是用了绝对值项。

    R^2


    看公式其实不难发现,它和MSE是有相似的,关键在于下面除了一个东西。简单的想就是相当于对预测值和真实值的趋势做了一个对比。

    SMSE

    比较

    首先从公式也能看出来,这三个基本上是R^2算一类,然后MSE和MAE算另一类。为什么呢?因为R^2相当于是对所有的数据都会有一个相同的比较标准。也就是说你得到一个值0.9999,那就非常好(当然对不同的应用你对好的定义可能会不一样,比如某些你觉得0.6就够了,某些你要0.8)。而MAE和MSE就是数据相关了,范围可以非常大,你单纯根据一个值完全不知道效果怎么样。

    而MAE 和MSE的选择主要是取决于你的应用场景,因为MSE会对离平均较远的点给一个更大的惩罚值(有平方嘛),而MAE则是给一个相对更小的。这个你可以参考这个链接3

    This depends on your loss function. In many circumstances it makes sense to give more weight to points further away from the mean--that is, being off by 10 is more than twice as bad as being off by 5. In such cases RMSE is a more appropriate measure of error.

    If being off by ten is just twice as bad as being off by 5, then MAE is more appropriate.

    http://stats.stackexchange.com/questions/48267/mean-absolute-error-or-root-mean-squared-error

    题目中为什么用了R^2

    这个我也是猜猜(毕竟不是我出的嘛),因为如果用另两个的话,你得出一个结果6.66,那么你怎么说这个好还是不好?根本没法说嘛。那这个问题你就没法回答了。

    PS:其实老版的project里面就有一个问题是说,让你为这个问题选择一个performance metric,其中最难分辨的就是MAE和MSE,你可以考虑下这个问题用哪个更好。

    来源:  http://blog.csdn.net/duxinyuhi/article/details/52233993

  • 相关阅读:
    hdu 1823 Luck and Love 二维线段树
    UVA 12299 RMQ with Shifts 线段树
    HDU 4578 Transformation 线段树
    FZU 2105 Digits Count 线段树
    UVA 1513 Movie collection 树状数组
    UVA 1292 Strategic game 树形DP
    【ACM】hdu_zs2_1003_Problem C_201308031012
    qsort快速排序
    【ACM】nyoj_7_街区最短路径问题_201308051737
    【ACM】nyoj_540_奇怪的排序_201308050951
  • 原文地址:https://www.cnblogs.com/tibetanmastiff/p/6692676.html
Copyright © 2020-2023  润新知