方案一:requests请求成功时,设置它的编码
1 def get_one(ur1): 2 res = requests.get(ur1) 3 res.encoding = '2312' #编码格式 4 if res.status_code == 200: 5 return res.text 6 return None
注:前提是知道它的编码,一般通过鼠标右键网页就可以查看网页原代码
方案二:利用apparent_encoding
1 res.encoding = res.apparent_encoding if res.encoding == 'IS0-8859-1' else res.encoding 2 print(res.apparent_encoding)
注:apparent_encoding本质上是requests本身对网页源码的猜测,如果猜不到,会返回None
方案三:先解成二进制,之后再转成想要的编码方式
1 res.content.decode("utf-8", "ignore").encode("gbk", "ignore") 2 print(res.text)
方案四:修改headers里的Accept-Encoding参数,如下:
1 headers = {'Accept-Encoding':'deflate'}