针对二分类的评估指标有Precision,Recall, F1-Score
TPR,FPR, TNR,FNR,AUC,Accuracy
真实结果 | |||
---|---|---|---|
1 | 0 | ||
预测结果 | 1 | TP(真阳性) | FP(假阳性) |
0 | FN(假阴性) | TN(真阴性) |
TP:预测为正类,并且预测正确
FP:预测为正类,预测错误
FN:预测为负类,预测错误
TN:预测为负类,预测正确
precision
准确率
[precision = frac{TP}{TP+FP}
]
预测为正类中多少个真的为正类,意味着可能存在负类预测为正类的情况(FP)
Recall
召回率
[recall = frac{TP}{TP+FN}
]
真实正类中有多少预测出来了,意味着有些真实正类预测为负类的情况(FN)
F1-score
综合考虑精准率P和召回率R
[F1 = 2* frac{P*R}{P+R}
]
TPR
真阳性率,其实就是召回率
[TPR = frac{TP}{TP+FN}
]
真实为阳性的,被预测为阳性比例,可能有真实为阳性预测为阴性的
FPR
假阳性率
[FPR = frac{FP}{FP+TN}
]
真实为阴性的,被预测为阳性比例,可能有真实为阴性并且预测为阴性的
TNR
真阴性率
[TNR = frac{TN}{TN+FP}
]
真实为阴性的,被预测为阴性比例,可能有真实为阴预测为阳性的
FNR
假阴性率
[FNR = frac{FN}{FN+TP}
]
真实为阳的,被预测为阴性比例,可能有真实为阳预测为阳的
ROC, AUC
以假阳率(FPR)为横坐标,真阳率(TPR)为纵坐标称为ROC曲线,ROC曲线下的面积为AUC,显然这个面积越大越好
精准率accuracy
就是分类正确的个数
[accuracy = frac{TP+TN}{TP+TN+FP+FN}
]