在写一个爬取智联招聘数据的爬虫中,将所需内容匹配到后打印出现了utf-8字符,并没有出现中文字符。
例如:
>>>listnine = ['梨', '橘子', '苹果', '香蕉']
>>>print 'listnine list: %s' % listnine
结果会是:
['xe6xa2xa8', 'xe6xa9x98xe5xadx90', 'xe8x8bxb9xe6x9ex9c', 'xe9xa6x99xe8x95x89']
但是我们想要输出的也是中文,而不是这一些东东,下面列出两种方法:
第一种:
使用decode('string_escape')
>>>listnine = ['梨', '橘子', '苹果', '香蕉']
>>>print 'listnine list: %s' % str(listnine).decode('string_escape')
这样就按原来的样子出来了
其中:
第二种:
使用uniout来完成
首先下载安装它:地址:https://pypi.Python.org/packages/source/u/uniout/uniout-0.3.7.tar.gz
然后会解压出一个目录:uniout-0.3.7
进入到这个目录:然后python setup.py install
在你的python文件前加条:import uniout 就可以了
>>>listnine = ['梨', '橘子', '苹果', '香蕉']
>>>print 'listnine list: %s' % listnine
依然这样写,出来就正常了^_^