• F1分数


    分类的常用指标有:

    accuracy:准确率

    recall:召回率

    precison:精确率

    f1score:f1分数,是recall和precison的调和均值。

     

    准确率什么情况下失效?

    在正负样本不均衡的情况下,accuracy这个指标有很大的缺陷。

    如:正样本990个,负样本10个。

    这样好像也没有什么用处哦?

    原因是关注正样本还是负样本。

    默认是关注正样本,而此时的正样本太多,就算混入几个副样本也无伤大雅。

    但大部分情况下是那10个才叫“正样本”,比如异常检测里,990个正常,10个异常,我们可能会更关注那10个异常。这10个异常叫做正样本。

    此时就有 10 个正样本,990个负样本。

    此时的准确率是多少呢?

    几个指标的通俗说明

     

    recall:召回率,也叫查全率。其实就是

     

    在上面的例子中,原本正样本990个负样本10个。预测结果为:1000个正样本。

    怎么计算召回率呢?

     

    召回率 = 预测对的所有正例 / 原本的所有正例

     

    • 1000个正例中,预测对的正例是多少呢?990个啊。
    • 原本的所有正例呢? 990个啊。 那么:

     

    当然查的越全越好,查的越准也越好。但一般情况下,这两个值是“此消彼长”的关系。所以就要有Fscore了,Fscore是R、P的调和均值,也是越大越好。一般用F1_score

     

  • 相关阅读:
    《数据结构
    《数据结构
    《数据结构
    《算法
    《linux 进程管理》- ps/top/kill/killall/nice
    《linux 字符处理》- grep/sort/uniq/tr/paste/sed/awk
    《linux 文件目录》- touch/rm/mv/cat/head/tail/cp/mkdir/chmod/chown/find/locate/which/whereis/tar
    MySQL优化必须调整的10项配置
    PV-UV
    linux+nginx+mysql+php高性能服务器搭建
  • 原文地址:https://www.cnblogs.com/hrnn/p/13552513.html
Copyright © 2020-2023  润新知