某些post接口,需要发送multipart/form-data类型的数据,如何使用python requests来模拟这种类型的请求发送呢?
根据http/1.1 rfc 2616的协议规定,我们的请求方式有OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE等。
http协议规定以ASCII码传输,建立在tcp,ip协议之上的引用规范。规范内容把http请求分成3个部分:状态行,请求头,请求体。所有的方法,实现都是围绕如何使用和组织这三部分来完成了,万变不离其宗。
post请求有两种编码格式:application/x-www-form-urlencoded 和 multipart/form-data
application/x-www-form-urlencoded
- application/x-www-form-urlencoded 常用在前端表单提交时,参数格式为:key=value&key=value。
- 如果参数中有特殊字符,则要进行url编码,编码格式就是application/x-www-form-urlencoded(规则:将键值对的参数用&连接起来;有空格转换为+加号;有特殊符号转换为ASCII HEX值)。
如:参数值中有&,需要转换为ASCII HEX值%26,对应ASCII中38位置的&。 - application/x-www-form-urlencoded是浏览器默认的编码格式。对于Get请求,是将参数转换为?key=value&key=value格式,连接到url后。
multipart/form-data
multipart/form-data格式不仅可以传输参数,还可以传输文件。也是在post基础上演变而来的,具体如下:
- multipart/form-data的基础方式是post,即基于post请求来实现的。
- multipart/form-data与普通post方法的不同之处在于请求头和请求体。
- multipart/form-data的请求头必须包含一个特殊的头信息:Content-Type,其值也必须为multipart/form-data;同时还需要规定一个内容分割用于分割请求体中不同参数的内容。
具体的头信息如下:Content-Type: multipart/form-data; boundary=${bound} - multipart/form-data的请求体也是一个字符串,和普通post请求的不同之处在于它的构造方式。普通post请求是简单的键值对连接,而multipart/form-data则是添加了分隔符、参数描述信息等内容的构造体。
关于boundary:
- 上面说到普通post请求使用 & 来分隔参数,那服务器使用
multipart/form-data格式
接收POST请求时,使用何种方式来分割参数的呢?答案是boundary。 - 由上图可以发现,HTTP的Body中使用两个短横线”–”加上boundary字符串作为不同参数的分割,而且不管是值参数(Value)还是文件参数(File)在Boundary内部都有自己的描述信息,并不是URL参数的简单移动。
并且在结束的时候,不仅前缀要加双短横线,后缀也要加,代表结束。
boundary快问快答:
Q:boundary的值是用户可以自由定义的吗?
A:是的,但为了避免和正常文本重复了,尽量要使用复杂一点的内容。
Q:boundary的作用?
A:分割参数,类似于普通post请求中的 &
使用python发送multipart/from-data类型数据
有两种方式:
- 手动组建form-data并修改headers
- 通过files参数传递form-data,推荐此种方式,这里只说这种方式
在官方网站上,requests模拟一个表单数据的格式如下:
files = {{name}: (<filename>, <file object>,<content type>, <per-part headers>)}
这一行模拟出来的post数据为:
Content-Disposition: form-data; name={name};filename=<filename>
Content-Type: <content type>
<file object>
--boundary
注:如果filename 和 content-Type不写,那么响应模拟post的数据就不会有二者。
通过上述说明,我们可以构造出files后直接post请求发送即可:
files = {
'schoolId': (None, -1),
'schoolName': (None, ""),
"reward": (None, 5),
"publishText": (None, "测试测试"),
"tags": (None, 1),
'image': ('image.jpg', open('%s/resource/upload_images/image.jpg' % PATH_DIR, 'rb'), 'application/octet-stream')
}
response = requests.post(url, files=files)