使用urllib2解析html内容，并正常显示中文的方法分类： python Module 2013-10-31 17:30 294人阅读评论(0) 收藏 - 润新知

使用urllib2解析html内容，并正常显示中文的方法分类： python Module 2013-10-31 17:30 294人阅读评论(0) 收藏
1. 获得目标html的编码格式
2. 按照此编码格式去解析html内容，就可以正常解析
import urllib2

target = urllib2.urlopen("http://www.amazon.cn")

print target.hearders #或使用target.info()，获得charset的内容为：utf-8

content=target.read().decode("utf-8") #此处对内容进行utf-8格式解码，否则print时会输出乱码

print content #正确解码，显示正常中文
相关阅读:
IE里ActiveXObject的一些实践
 JS兼容性问题汇总
 js:apply/call
mark 一些近来用过的js库
 (转)时序分析基本概念
 (转载) 使用TimeQuest时序分析器
 (转)Altera对应的时序概念
 有序符号表（二叉树实现，JAVA，算法(四)）
有序符号表（数组实现，JAVA，算法(四)，二分法）
无序符号表（链表实现，JAVA，算法(四)）
原文地址：https://www.cnblogs.com/think1988/p/4628035.html

Copyright © 2020-2023 润新知