• 分类问题的评价指标


    通常以关注的类为正类,其他类为负类,分类器在数据集上的预测或者正确或者不正确,我们有 $4$ 种情况:

        1)TP:True Positive, 把正类预测为正类;

        2)FP:False Positive,把负类预测为正类;

        3)TN:True Negative, 把负类预测为负类;

        4)FN:False Negative,把正类预测为负类

    准确率:对于给定的数据,分类正确的样本数占总样本数的比例,即

    $$accuracy = frac{TP + TN}{TP + FP + TN + FN}$$

    精确率:指在预测为正类的样本中真正类所占的比例,即

    $$precision = frac{TP}{TP + FP}$$

    召回率:指在所有的正类中被预测为正类的比例,即

    $$recall = frac{TP}{TP + FN}$$

    一般来说,$precision$ 就是检索为正类的条目中有多少是准确的,$Recall$ 就是所有准确的正类条目有多少被检索出来了。

    $F_{1}-Score$: 精确率和召回率的调和平均,因为 $precision$ 和 $recall$ 是一对相互矛盾的量,当 $P$ 高时,$R$ 往往相对较低,当 $R$ 高时,

    $P$ 往往相对较低,所以为了更好的评价分类器的性能,一般使用 $F_{1}-Score$ 作为评价标准来衡量分类器的综合性能。

    $$frac{1}{F_{1}} = frac{1}{P} + frac{1}{R} \
    Rightarrow F_{1} = frac{2 cdot P cdot R}{P + R}$$

  • 相关阅读:
    让DIV实现抖动效果!
    Linux下如果python2和python3同时存在使用pip3
    Eclipse 查找一个接口的具体实现
    linux下编译安装软件到指定目录
    NG机器学习-octave基本操作
    NG机器学习
    全注解方式构建SpringMVC项目
    Java多线程学习开发笔记
    RabbitMQ 学习开发笔记
    Redis 学习开发笔记
  • 原文地址:https://www.cnblogs.com/yanghh/p/13896089.html
Copyright © 2020-2023  润新知