add by zhj: 其实一般情况下,不会遇到变量c这种编码的,往往是哪些出错了,才会出现这种情况。所以遇到这种情况,要先
查看代码,避免这种情况的出现
原文:https://mozillazg.com/2013/12/python-raw-unicode.html
见下面的代码,我们知道,对于unicode字符串,是像b那样的格式,即u'u6211u7231Python',而c中的包含的其实是utf-8编码的,
a就是utf-8编码的。那怎么去掉c前面的u呢?Python提供了方法unicode.encode('raw_unicode_escape')
In [91]: a = '我爱Python' In [92]: a Out[92]: 'xe6x88x91xe7x88xb1Python' In [93]: b = u'我爱Python' In [94]: b Out[94]: In [95]: c = u'xe6x88x91xe7x88xb1Python' In [96]: print c # 乱码 æç±Python In [97]: c Out[97]: u'xe6x88x91xe7x88xb1Python' In [98]: d = In [99]: d Out[99]: 'xe6x88x91xe7x88xb1Python' In [100]: print d 我爱Python