urllib.request模块是python3针对处理url的。
1. 首先导入:
from urllib import request
2. 构造url,构造url的headers信息和传参【request.Request】
----不带参数的get请求【略】
----带参数的get请求【带header,带data,带header和data,带预发host】
导入:from urllib import parse
import json
url = r"xxxxx"【注:如果配置host的话,此处要将地址中的host域名改写成host地址】
headers = {'Host' : ' 域名 ',
'cookie' = 'xxxx',
}
data = {'canshu1' = aaa,
'canshu2' = bbb,
'canshu3' = ccc,
'canshu4' = ddd
}
data = parse.urlencode(data).encode('utf-8')
req = request.Request(url,headers=headers,data=data)
3. 请求url【request.urlopen】,并获取返回参数【.read()】
page = request.urlopen(req).read
page = page.decode(utf-8)
4. 将返回的json格式转换为python的数据结构【json.loads(xx)】
page_python = json.loads(page)
5. 分析返回的数据类型,并多次循环得到想要的内容
--打印数据类型:print(type(a))
--直接获取字典value值:page_python['key值1']['key值2']['key值3']