目的:复习常用的response对象的属性
import requests
url = "http://www.baidu.com"
r = requests.get(url)
print(r.status_code) #状态码
print(r.content) #响应内容为二进制形式
print(r.text) #响应内容为字符串形式,但是print出来是乱码
print(r.encoding) #返回的编码方式为"ISO-8859-1",不认识
print(r.apparent_encoding) #返回的编码方式为"utf-8",认识
r.encoding = 'utf-8'
print(r.text) #print出来不是乱码,因为变更了encoding方式
总结两种编码
r.encoding:从header中猜测的响应方式,比如百度……header中就没有charset字段,会直接默认了"ISO-8859-1"
r.apparent_encoding:分析内容找到的,很实在