1,在用get方法时,可在网址后加一个问号?表示传递参数
例:repose=requests.get('http;//httpbin.org/get?name=germey&age=22')
2 ,也可在get中设置params参数(要求后面添加的参数为字典的形式)
例:repose=requests.get('http;//httpbin.org/get,params={'name':'germy','age'=22}
3 ,在获取源代码得到的是杂乱无章的时候,可用josn,即名字.json或json.loads(名字.text)
4,用get方式获取图片时,如果直接用名字.text输出网页源代码时,得到的是乱码,要获取图片则要获取图片的二进制代码,可以用名字.content
(如何把网页上的图片爬取下来?在get网址后,用with open(‘新建一个文件名.图片后缀’,‘wb’)as**: 再用**.write(获取图片二进制源码的方式)
5,在爬取网页数据时,如若不被允许,可以仿造浏览器来爬取
6,请求要有请求头,有了请求头会更像是浏览器在访问数据,找到网页中F12的请求头代码,,创建一个变量,使得变量={‘请求头名’:‘请求头代码’}
7,在get获得网页时get(‘网址’,变量名=变量名)
8,状态码判断:在访问网络不成功时,可用exit()if not 名字.status_code==200
else print(‘Request Successful’)表示如果状态码为200访问不成功时,则退出,否则则输出Request Successful
9,如何把一个图片上传到网络?
设置一个变量为files,files={‘files’:open(‘图片名’,‘rb’)}
value值为操作系统open接口类型(上传文件,图片均用post)
名字=request.post(‘网址’,files=files)
10,访问网站出现不安全提示时,可用package下urllib3类库下的警告类库-------urllib3.disable_warnings()再用get访问(‘网址’,verify=False)
其中verify=False是指不要出现验证方式
11,访问超时的设置,可以设置访问时间超过多久就退出,用requests类库中Exception类,再导入Timeout
名字=requests.get(‘网址’,timeout=1)访问该网址超过1秒就停止,输出状态码