在多数的机器学习比赛中,给出的标签都是非数字化的,所以我们需要对其进行转换。代码如下:
from sklearn import preprocessing feature = [[0,1], [1,1], [0,0], [1,0]] label= ['yes', 'no', 'yes', 'no'] lb = preprocessing.LabelBinarizer() #构建一个转换对象 Y = lb.fit_transform(label) re_label = lb.inverse_transform(Y) print(Y) print(re_label)
输出
[[1] [0] [1] [0]]
['yes' 'no' 'yes' 'no']
转换函数将字符串label进行数字化,数字范围从0开始,并且将label转换为了一个列向量。最后在ML任务完成之后,输出的时候需要还原之前的label,因此使用函数inverse_transform()。
————————————————
原文链接:https://blog.csdn.net/twt520ly/article/details/79538329