一、Requests库的安装
win平台下,直接在命令行使用
pip install requests
即可进行安装
成功后测试如下
>>> import requests >>> r = requests.get('https://www.baidu.com') >>> print(r.status_code) 200 >>> r.text '<!DOCTYPE html> <!--STATUS OK--><html>
二、Requests库的七个主要方法
- requests.requests() 用于构造一个请求,支撑以下各方法的基础方法
- requests.get() 获取HTML网页的主要方法,对应于HTTP的GET
- requests.head() 获取HTML网页头信息的方法,对应于HTTP的HEAD
- requests.post() 向HTML网页提交POST请求的方法,对应于HTTP的POST
- requests.put() 向HTML网页提交PUT请求的方法,对应于HTTP的PUT
- requests.patch() 向HTML网页提交局部修改请求,对应于HTTP的PATCH
- requests.delete() 向HTML页面提交删除请求,对应于HTTP的DELETE
三、Requests库的get()方法
get()方法是最常用的方法
requests.get(url,params=None, **kwargs)
其中:
- url:想要获取的网页url
- params: url中的额外参数,字典或字节流格式,如kw = {'wd': 'baidu'}, requests.get('https://www.baidu.com', kw),其中访问的地址是https://www.baidu.com/?wd=baidu, 可选参数
- **kwargs: 12个控制访问的参数(较为少用)
四、两个重要的对象:Request和Response
对于r = requests.get(url), 其实是先构造了一个向服务器请求资源的Request对象,然后返回一个包含服务器资源的Response对象
PS:其实在requests库的源码中可以得知get是对request方法进行了封装
Response对象基本的属性:
- r.status_code HTTP请求的返回状态,200表示连接成功,404表示失败
- r.headers 返回Response对象的头部信息
- r.text HTTP响应内容的字符串形式,即,url对应的页面内容
- r.encoding 从HTTP header中猜测的响应内容编码方式
- r.apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式)
- r.content HTTP响应内容的二进制形式
有一点需要注意:如果在header中不存在charset,这认为编码为ISO‐8859‐1,r.encoding将为这个编码
r.apparent_encoding为程序根据网页内容分析出的编码,若网页编码已知的话,可以省略对此处进行一点小小的优化
五、异常
Requests库的异常
- requests.ConnectionError 网络连接错误异常,如DNS查询失败、拒绝连接等
- requests.HTTPError HTTP错误异常
- requests.URLRequired URL缺失异常
- requests.TooManyRedirects 超过最大重定向次数,产生重定向异常
- requests.ConnectTimeout 连接远程服务器超时异常
- requests.Timeout 请求URL超时,产生超时异常
Response类的异常
r.raise_for_status() 如果不是200 这抛出异常requests.HTTPError,便于对异常的处理
-------
本文整理自嵩天老师的python系列课程,如有错误,还请斧正