机器学习:准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线
在介绍指标前必须先了解“混淆矩阵”:
混淆矩阵
True Positive(真正,TP):将正类预测为正类数,是正的,也预测正的
True Negative(真负,TN):将负类预测为负类数,是负的,也预测负的
False Positive(假正,FP):将负类预测为正类数误报 (Type I error),是负的,预测为正的
False Negative(假负,FN):将正类预测为负类数→漏报 (Type II error),是正的,预测为负的
1、准确率(Accuracy)
分子:正正+负负
分母:正负+负正+正正+负负
准确率(accuracy)计算公式为:
2、错误率(Error rate)
分子:负正+正负
分母:所有
错误率则与准确率相反,描述被分类器错分的比例,error rate = (FP+FN)/(TP+TN+FP+FN),对某一个实例来说,分对与分错是互斥事件,所以accuracy =1 - error rate。
3、灵敏度(sensitive)、召回率
分子:正正,
分母:正正+正负
sensitive = TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力。
4、特效度(sensitive)
分子:负负
分母:负负+负正
specificity = TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力。
5、精确率、精度(Precision)
分子:正正
分母:正正+负正
精确率(precision)定义为:
表示被分为正例的示例中实际为正例的比例。