在做svm分类试验时,对于结果的处理,仅用一种指标很难得到正确评估算法的效果。所以,一般要用到precision(精确率),recall(召回率),F-measure、accuracy(准确率)四个指标。
首先认识四个与其相关参数:
相关(Relevant),正类 | 无关(NonRelevant),负类 | |
被检索到(Retrieved) | true positives(TP 正类判定为正类) | false positives(FP 负类判定为正类,"存伪") |
未被检索到(Not Retrieved) | false negatives(FN 正类判定为负类,"去真") | true negatives(TN 负类判定为负类) |
accuracy(准确率):(TP+TN)/(TP+FP+FN+TN)
precision(精确率):TP/(TP+FP)
recall(召回率) :TP/(TP+FN)
F-measure :2/F=1/P+1/R < -------> 2TP/2TP+FP+FN
网上一个例子:
假如某个班级有男生80人,女生20人,共计100人.目标是找出所有女生.
现在某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了.
作为评估者的你需要来评估(evaluation)下他的工作
其中:TP=20 FP=30 FN=0 TN=50 accuracy=70 %(70 / 100)【70(20女+50男)】,precision=40%【20女生/(20女生+30误判为女生的男生)】
recall=100%【20女生/(20女生+
0 误判为男生的女生)】 F-measure=57.143%(