分类任务中性能度量及代码 Learner

分类任务中性能度量及代码 Learner
样本

　　正样本：即属于某一类（一般是所求的那一类）的样本。在本例中是及格的学生。
　　负样本：即不属于这一类的样本。在本例中是不及格的学生。
```
　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
```
　　上述 0 代表不及格，1 代表及格。这里正样本代表及格。

TP、FP、FN、TN

正类负类

被检索 True Positive False Positive

未检索 False Negative True Negative
- TP：被检索到正样本，实际也是正样本（正确识别）
　　　　在本例表现为：预测及格，实际也及格。本例 TP=2
- FP：被检索到正样本，实际是负样本（一类错误识别）
　　　　在本例表现为：预测及格，实际不及格。本例 FP=2
- FN：未被检索到正样本，实际是正样本。（二类错误识别）
　　　　在本例表现为：预测不及格，实际及格了。本例 FN=2
- TN：未被检索到正样本，实际也是负样本。（正确识别）
　　　　在本例表现为：预测不及格，实际也不及格。本例 TN=4

代码：
from sklearn.metrics import confusion_matrix y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0] y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1] TN, FP, FN, TP = confusion_matrix(y_true, y_pred).ravel() print(TN, FP, FN, TP)
结果：4 2 2 2

Accuracy（准确率、精度）
　　　　$\operatorname{acc}(f ; D) =\frac{1}{m} \sum \limits _{i=1}^{m} \mathbb{I}\left(f\left(\boldsymbol{x}_{i}\right)=y_{i}\right) =1-E(f ; D)$

　　　　$A C C=\frac{T P+T N}{T P+T N+F P+F N}$

　　分类正确的样本数与样本总数之比。

　　在本例中，

　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1] 　　

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]

　　正确分类了6人（及格2人 + 不及格4人），所以 Accuracy = 6 / 10 = 60%.

代码：
from sklearn.metrics import accuracy_score y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0] y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1] print(accuracy_score(y_true, y_pred))
结果：

0.6

Precision（精确率、查准率）
　　　　$P=\frac{T P}{T P+F P}$

　　被正确检索的样本数与被检索到样本总数之比。

　　在本例中，
　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
- - 不及格类：检索到 6人，正确检索 4人，所以Precision = 4 / 6 = 0.6667.
  - 及格类：检索到 4 人，正确检索 2人，所以Precision = 2 / 4 = 0.5.
代码：
```
from sklearn.metrics import precision_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
print(precision_score(y_true, y_pred, average=None))  #4/6   2/4
```
结果：

[0.66666667 0.5 ]

Recall （召回率、查全率）

　　　　$P=\frac{T P}{T P+F P}$

　　被正确检索 (y_pred) 的样本数与 应当被检索 (y_true) 到的样本数之比。（这里暂时先不适应上述相同样本数据，否则和Precision结果一样，怕搞混）

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
　　y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]

　　在本例中，
- - 不及格类：应当检索到 6人，正确检索 3人，所以 Recall = 3 / 6 = 0.5.
  - 及格类：应当检索到 4 人，正确检索 3人，所以 Recall = 3 / 4 = 0.75.
结果：

[0.5 0.75]

F1 Score

　　　　$F 1=\frac{2 \times P \times R}{P+R}$

　　在本例中，

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
　　y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]
- - 不及格类：P=3/4， R=3/6
  - 及格类：P=3/6， R=3/4
代码：
```
from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average=None))
print(recall_score(y_true, y_pred, average=None))
print( f1_score(y_true, y_pred, average=None ))
# 不及格类
p=3/4
r=3/6
print((2*p*r)/(p+r))
# 及格类
p=3/6
r=3/4
print((2*p*r)/(p+r))
```
结果：

[0.75 0.5 ]
[0.5 0.75]
[0.6 0.6]
0.6
0.6

宏平均

　　是先对每一个类统计指标值，然后在对所有类求算术平均值。

　　　　$macro-P =\frac{1}{n} \sum \limits _{i=1}^{n} P_{i}$

　　　　$macro -R =\frac{1}{n} \sum \limits _{i=1}^{n} R_{i}$

　　　　$macro -F1 =\frac{2 \times macro-P \times macro-R}{macro-P+macro-R}$

代码：
```
from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average=None))
print(recall_score(y_true, y_pred, average=None))
print(precision_score(y_true, y_pred, average="macro"))
print(recall_score(y_true, y_pred, average="macro"))
print(f1_score(y_true, y_pred, average="macro"))
```
结果：

[0.75 0.5 ]
[0.5 0.75]
0.625
0.625
0.6

微平均

　　是对数据集中的每一个实例不分类别进行统计建立全局混淆矩阵，然后计算相应指标。

　　　　$micro-P=\frac{\overline{T P}}{\overline{T P}+\overline{F P}} $

　　　　$micro-R=\frac{\overline{T P}}{\overline{T P}+\overline{F N}} $

　　　　$micro-F 1=\frac{2 \times micro-P \times micro-R}{ micro-P+\text { micro }-R}$

　　看成一类，造成的结果是 $micro-P = micro-R $。

代码：
```
from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 2, 2, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 2, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average="micro"))
print(recall_score(y_true, y_pred, average="micro"))
print(f1_score(y_true, y_pred, average="micro"))
```
结果：

0.5
0.5
0.5

混淆矩阵

　　第 $i$ 行代表第 $i$-th class，每列表示把 $i$-th class 分配到 $j$-th class 中的个数

代码：
```
from sklearn.metrics import confusion_matrix
y_true = [1, 1, 1, 2, 2, 3]
y_pred = [1, 1, 2, 1, 2, 3]
print(confusion_matrix(y_true, y_pred))
```
结果：

[[2 1 0]

[1 1 0]

[0 0 1]]

代码：
```
y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]
y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]
print(confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"]))
```
结果：

[[2 0 0]

[0 0 1]

[1 0 2]]

分类报告

　　将上述结果，用report的形式展示出来

代码：
```
from sklearn.metrics import classification_report
y_true = [0, 1, 2, 2, 0]
y_pred = [0, 0, 2, 2, 0]
target_names = ['class 0', 'class 1', 'class 2']
print(classification_report(y_true, y_pred, target_names=target_names))
```
结果：

真正率、假正率

　　真正率 (TPR ) = 灵敏度/召回率 =

　　　　　　　　

　　　　　　　　

P-R曲线
- 若一个学习算法的PR曲线被另一个学习算法的曲线完全“包住”，则可认为后者的性能优于前者，如A优于C；
- 若两个学习算法的PR曲线发生交叉（如A和B），则难以判断孰优孰劣，只能在具体的查准率和查全率条件下进行比较；
  - 可通过比较P-R曲线下的面积（PR-AUC）
  - 利用平衡点（即P=R时的取值）
  - 利用F1度量
　　　　

ROC

AUC

代价敏感错误率

略

『总结不易，加个关注呗！』

　　　　　　　　
因上求缘，果上努力~~~~ 作者：Learner-，转载请注明原文链接：https://www.cnblogs.com/BlairGrowing/p/15646116.html
相关阅读:
angular2+ 使用ant.design 的 select组件时（nz-select）下拉框没有脱离文档流，直接撑开页面展示的问题
 element 获取table组件的下标
 调幅调频调相位
 Mongoose基于MongoDB建模并设置关联
 Xavier上TensorRT和Pytorch运行时间对比
 理解vue实例的生命周期和钩子函数
 [Vue]组件——.sync 修饰符实现对prop 进行“双向绑定”（子组件向父组件传值）
vm.$attrs 【Vue 2.4.0新增inheritAttrs，attrs详解】
(转)vue v-on修饰符
 Vue中的computed属性
原文地址：https://www.cnblogs.com/BlairGrowing/p/15646116.html

	正类	负类
被检索	True Positive	False Positive
未检索	False Negative	True Negative

分类任务中性能度量及代码 Learner

TP、FP、FN、TN

Accuracy（准确率、精度）

Precision（精确率、查准率）

Recall （召回率、查全率）

F1 Score

宏平均

微平均

混淆矩阵

真正率、假正率

P-R曲线