方法 | 说明 |
requests.request() | 构造一个请求,支撑一下各方法的基础方法 |
requests.get() | 获取HTML网页的主要方法 |
requests.head() | 获取网页头信息的方法 |
requests.post() | 向HTML网页提交POST请求的方法 |
requests.put() | 向HTML网页提交PUT请求的方法 |
requests.patch() | 向HTML网页提交局部修改请求 |
requests.delete() | 向HTML页面提交删除请求 |
requests.request(method,url,**kwargs)--------method请求方式
r = requests.request('GET',url,**kwargs) |
r = requests.request('HEAD',url,**kwargs) |
r = requests.request('POST‘’,url,**kwargs) |
r = requests.request('PUT',url,**kwargs) |
r = requests.request('PATCH',url,**kwargs) |
r = requests.request('DELETE',url,**kwargs) |
r = requests.request('OPTIONS',url,**keargs) |
requests.request(method,url,**kwargs)--------**kwargs访问控制参数(可选项)
•params:字典或字节序列,作为参数增加到URL中
1 kv = {'key1' : 'value1','key2': 'value2'} 2 r = requests.request('GET','http://www.baidu.com',params = kv) 3 print(r.url) 4 #output:http://www.baidu.com?key1=value1&key2=value2
•data:字典、字节序列或文件对象,作为request的内容,但是并不放到URL链接里,放在URL链接对应位置作为数据存储;当然也可以把一个字符串赋值给data,该字符串放在URL所对应的位置。
1 kv = {'key1' : 'value1','key2': 'value2'} 2 r = requests.request('POST','http://www.baidu.com',data = kv) 3 body = '主体内容' 4 r = requests.request('POST','http://www.baidu.com',data = body)
•json::JSON数据,作为request的内容提交,放在服务器的json里面
1 kv = {'key1' : 'value1','key2': 'value2'} 2 r = requests.request('POST','http://www.baidu.com',json = kv)
•headers:字典,HTTP定制头
1 hd = {'user-agent':'Chrom/10'}#模拟版本10的Chrome浏览器 2 r = requests.request('POST','http://www.baidu.com',headers = hd)
•cookies:字典或CookieJar,request中的cookie
•auth:元组,支持HTTP认证功能
•files:字典类型,向某个链接提交传输文件
1 fs = {'file': open('data.xls','rb')} 2 f = requests.request('POST','http://www.baidu.com',files = fs)
•timeout:设定超时时间,单位为s.如果规定时间内服务器不能返回就会产生一个timeout异常
1 r = requests.request('GET','http://wwww.baidu.com',timeout = 10)
•proxis:字典类型,设定访问代理服务器,可以增加登录认证,如增加登录用户名和密码。主要用于隐藏爬取网页的源网站,防止爬虫的逆追踪。
1 pxs = {'htttp':'http://user:pass@10.10.10.1:1234' 2 'https':'https:10.10.10.1:4321'} 3 r = requests.request('GET','http://www.baidu.com',proxies = pxs)
•allow_redirects:True/False,默认为True,重定向开关
•steam:True/False,默认为True,获取内容后立即下载
•verify:True/False,默认为True,认账SSL证书开关
•cert:本地SSL证书路径
HTTP的方法:
方法 | 说明 |
GET | 请求获取URL位置的资源 |
HEAD | 请求获取URL位置资源的响应消息报告,即获得该资源的头部信息 |
POST | 请求向URL位置的资源后附加新的数据 |
PUT | 请求向URL位置存储一个资源,覆盖原URL位置的资源 |
PATCH | 请求局部更新URL位置的资源,即改变该处资源的部分内容 |
DELETE | 请求删除URL位置存储的资源 |