(原创)
机器学习模型指标小记:
以预测疾病为例,预测病人是否患病或健康。正向:病人,反向:健康
TP:正向预测正确,即病人被预测为病人
FP:反向预测错误,即健康被预测为疾病
FN:正向预测错误,即病人被预测为健康
TN:反向预测正确,即健康被预测为健康
recall(召回,又叫hit rate,sensitivity,true positive rate(TPR)):
TP/(TP+FN) ,正向预测准的,占所有正向人员的比例,
即预测到的病人数占总真实病人数的比例
false postive rate(FPR):
FP/(FP+TN) , 反向预测错误的,占所有反向人员的比例
即预测为病人的健康人,占所有健康人的比例。
precision:
TP/(TP+FP), 正向预测准的,占所有预测正向数的比例
即预测准的病人数占总预测病人数的比例
accuracy:
(TP+TN) /(TP+FP+TN+FN) , 全部预测准的,占总数的比例
即预测准的病人和预测准的健康人,占所有人比例
F1 分数: recall 和 precision 的调和平均
ROC 曲线:横轴为FPR,纵轴为recall
AUC: area under curve,ROC曲线下的面积