在爬取新浪财经7*24直播中, 遇到了Unicode编码中文转utf-8的问题, 采用如下代码可以实现转化
>>> a='\u76d1\u7ba1\u5bf929' >>> a '\u76d1\u7ba1\u5bf929' >>> a=a.encode('latin-1').decode('unicode_escape') >>> a '监管对29'
在转换中遇到/的显示问题, 采用如下方法解决
li = re.sub(r'\/', '/', li) # 先剔除类似'u5143GBP/USDu77ed'中/的\,避免误伤其他的
具体案例可见我的gitee
https://gitee.com/bob1112/pythonPaChong/blob/master/sina_spider.py