http://zhidao.baidu.com/question/439580540.html
问题:
最近用python抓网页,遇到一个大问题。网页上抓来的是以普通字符串形式存在的unicode编码,例如 '\u56c3\u67e4',而不是u'\u56c3\u67e4',我现在想要显示中文,该怎么办?
答案:
'\u56c3\u67e4' 转 u'\u56c3\u67e4':
方法1: text = eval("u"+"'\u56c3\u67e4'")
方法2: s = '\u56c3\u67e4' text = "".join(unichr(int(c, 16)) for c in s.split('\u')[1:])