TP、True Positive 真阳性:预测为正,实际也为正
FP、False Positive 假阳性:预测为正,实际为负
FN、False Negative 假阴性:预测与负、实际为正
TN、True Negative 真阴性:预测为负、实际也为负。
也就是说,预测和实际一致则为真,预测和实际不一致则为假;如果预测出来是“正”的,则为“阳”,预测结果为 “负”,则为“阴”。
先看一个简单的二分类问题。
比如说总共有100个人,其中60个人患有疾病,40个人是健康的。我们的要找出里面的病人,我们一共找出了50个我们认为的病人,其中40个确实是病人,另外10个是健康的。因为我们要找的是“病人”,所以“病人”就是正样本,健康者是负样本。
TP 正阳性:预测为正,实际也为正,也就是预测为病人,实际也是病人的样本数目,一个有40个。
FP 假阳性:预测为正,实际为负。预测为病人,但实际不是病人,有10个。
FN 假阴性:预测为负,实际为正。我们找出了50个我们认为的病人,剩下50个我们认为都是健康的,但事实上剩下的50个人中,有20个是病人。这20个就是假阴性的数目。预测没病,但实际有病。
TN 真阴性:预测为负,实际为负。我们找出了50个我们认为的病人,剩下的50个就是我们预测的负样本,但是这50个样本中,有20个是病人,剩下30个才是负样本,所以真阴性的个数为30。
以一个等级预测为例。
为了叙述方便,下文一律把“等级”称呼为“类”。
首先看真阳性TP:预测为正,实际也为正。也就说本来属于哪个类,预测出来还是那个类,就叫真阳性。对于类A而言,实际是A,预测出来还是A的有“璇璇”和“晓慧”,那么类A的真阳性TP的个数为2。对于类B而言,实际是B,预测出来还是B(说成预测出来是B,实际也是B是等效的)的只有“鱼丸”,所以类B的真阳性个数为1。同理对于类C而言,真阳性TP的个数也为1。
接下来看假阳性FP:预测为正,实际为负。就是说你预测她是某个类,但她实际不是,就是假阳性。对于类A而言,假阳性FP的个数为1,就是“奶副”,预测为A,但实际是B。对于类B而言,假阳性FP的个数为3,分别是“美君”,“梦慧”和“甜甜”,预测出来是B,但实际都不是。类C的假阳性FP个数为1,是“菌菇”,预测出来是C,但实际是B。
假阴性FN,预测与负、实际为正。就是预测不是,但是实际是,还是结合前边的表格来看。对于类A而言,假阴性就是预测不是A,但实际是A(注意和假阳性的区别),这样的情况有“美君”,预测为B(负),但实际是A(正)所以类A假阴性的个数为1。类B假阴性的,有“奶副”和“菌菇”,所以为2。同理类C的假阴性个数为2,分别是“甜甜”和“梦慧”。
至于真阴性在多分类中的应用我暂时还没搞明白。不过无碍,毕竟还是用Precision和Recall比较多,而这两个用不到真阴性。