今天一个问题困扰了我一段时间,就是有关python2读取文件中含有中文的文字片段 读取过程中会乱码,分享一下文件内容,如下图所示:
分享一下读取的代码如下:
file_path = r'D: estmtcnn_asian1.txt'
file_name = open(file_path, 'r').readlines()
for i in file_name:
print i
读取结果如下:
face_data�������������Ӿ� _0.jpg
face_data�������������Ӿ�102_0.jpg
�����ף����
发现全是乱码了,不管我一顿捯饬,基本上所有的的编码格式都用了,结果还是出不来中文,你可以自己试试吧,我这里直接分享我正确的解析代码,如下图:
file_path = r'D: estmtcnn_asian1.txt'
file_name = open(file_path, 'r').readlines()
for i in file_name:
print i.decode("gb2312")
读取结果如下:
face_data华人男明星丁子峻 _0.jpg
face_data华人男明星丁子峻102_0.jpg
祖国我祝福你
果然是一顿操作猛如虎 到最后原来这么简单的问题,果然是自己 low low 呀