• (转载)准确率(accuracy),精确率(Precision),召回率(Recall)和综合评价指标(F1-Measure )-绝对让你完全搞懂这些概念


    自然语言处理(ML),机器学习(NLP),信息检索(IR)等领域,评估(evaluation)是一个必要的工作,而其评价指标往往有如下几点:准确率(accuracy),精确率(Precision),召回率(Recall)和F1-Measure。

    本文将简单介绍其中几个概念。中文中这几个评价指标翻译各有不同,所以一般情况下推荐使用英文。

    现在我先假定一个具体场景作为例子:

    假如某个班级有男生80人,女生20人,共计100人.目标是找出所有女生.
    现在某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了.
    作为评估者的你需要来评估(evaluation)下他的工作

    将挑选结果用 矩阵示意表来表示 : 定义TP,FN,FP,TN四种分类情况

      相关(Relevant),正类 无关(NonRelevant),负类
    被检索到(Retrieved) TP 系统检索到的相关文档,例"其中20人是女生" FP 系统检索到的不相关文档,例”错误把30个男生当女生“
    未被检索到(Not Retrieved) FN 相关系统未检索到的文档,例"未挑0人是女生" TN 相关但是系统没有检索到的文档,例”未挑50人非女生“

    准确率(accuracy)的公式是,其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。也就是损失函数是0-1损失时测试数据集上的准确率

    A = (20+50) / 100 = 70%

    精确率(precision)的公式是,它计算的是所有被检索到的item中,"应该被检索到"的item占的比例。

    P = 20 / (20+30) = 40%

    召回率(recall)的公式是,它计算的是所有检索到的item占所有"应该检索到的item"的比例。

    R = 20 / (20 + 0) = 100%

    综合评价指标(F-Measure)是Precision和Recall加权调和平均:

    F = frac{(a^2+1)P*R} {a^2(P+R)} hfill (3)

    当参数a=1时,就是最常见的F1了:

    F1 = frac{2PR} {P+R} hfill (4)

    P和R指标有的时候是矛盾的,综合考虑精确率(precision)和召回率(recall)这两个度量值。很容易理解,F1综合了P和R的结果,当F1较高时则比较说明实验方法比较理想。

    F1 = 2*0.4*1 / (0.4 + 1) = 57%

  • 相关阅读:
    背水一战 Windows 10 (90)
    背水一战 Windows 10 (89)
    背水一战 Windows 10 (88)
    背水一战 Windows 10 (87)
    背水一战 Windows 10 (86)
    背水一战 Windows 10 (85)
    背水一战 Windows 10 (84)
    背水一战 Windows 10 (83)
    背水一战 Windows 10 (82)
    背水一战 Windows 10 (81)
  • 原文地址:https://www.cnblogs.com/demo-deng/p/10030127.html
Copyright © 2020-2023  润新知