• 方差与偏差,bias vs variance


    一、方差与偏差文字与数学解释

    (1)文字解释

    • 偏差:预测值与真实值的差值
    • 方差:预测值与训练数据集值的差值

    (2)数学解释

    • 对测试样本的预测值  $y-f(x;D)$
    • 泛化误差:$Err(x)=E[(y-f(x;D))^{2}]$
    • 测试样本的均值 $ar{f}=E_{D}[f(x;D)]$,例如有5个样本分别为1,1,0,0,0   则$ar{f}=0.4$
    • 真实值$y_{D}$,数据集上的标签值,y是理论上正确的值。

    对泛化误差进行分解:

    $Err(x)$$=E[(y-f(x;D))^{2}]$

        $=E_{D}[f(x;D)-ar{f}+ar{f}-y_{D}]$

        $=E_{D}[(f(x;D)-ar{f})^{2}] +E_{D}[(ar{f}-y_{D})^{2}]+E_{D}[2(f(x;D)-ar{f})(ar{f}-y_{D})]$

          $=E_{D}[(f(x;D)-ar{f})^{2}]+E_{D}[(ar{f}-y_{D})^{2}]$

          $=E_{D}[(f(x;D)-ar{f})^{2}]+E_{D}[(ar{f}-y+y-y_{D})^{2}]$

          $=E_{D}[(f(x;D)-ar{f})^{2}]+E_{D}[(ar{f}-y)^{2}]+E_{D}[(y-y_{D})^{2}]+2E_{D}[(ar{f}-y)(y-y_{D})]$

          $=E_{D}[(f(x;D)-ar{f})^{2}]+(ar{f}-y)^{2}+E_{D}[(y-y_{D})^{2}]$

    • 方差 $E_{D}[(f(x;D)-ar{f})^{2}]$ 
    • 偏差 $(ar{f}-y)^{2}$ 
    • 误差 $E_{D}[(y-y_{D})^{2}]$

    一些解释:

     $E_{D}[2(f(x;D)-ar{f})(ar{f}-y_{D})]$ 这项展开为0

     $2E_{D}[(ar{f}-y)(y-y_{D})] 这项展开为0$

    二、图形解释

    • 中心红点为真实值
    • 结合数学解释,如果预测值距离中心点近则为低偏差
    • 结合数学解释,如果预测值比较密集则为低方差 

    三、测试集、训练集合的误差与方差、偏差之间的关系

    测试集误差 训练集误差 方差 variace 偏差 bias
    小(这种情况是过拟合

    所以实际情况,我们的方差和偏差都越小越好。

  • 相关阅读:
    SSH出现Connection refused错误
    Lisp经典算法
    Arch Linux下韩文重叠显示
    Vim在图形环境下全屏产生黑边
    Vim常用插件安装及配置方法
    Python中Scrapy框架元素选择器XPath的简单实例
    Manjaro下Steam无法启动
    GNOME禁用GDM中night-light功能
    Neovim中提示Error: Required vim compiled with +python
    Manjaro下带供电的USB Hub提示error -71
  • 原文地址:https://www.cnblogs.com/ylxn/p/11972391.html
Copyright © 2020-2023  润新知