HTTP协议
Hyper Text Transfer Protocol(超⽂本传输协议)的缩 写,是⽤于从万维⽹(WWW:World Wide Web )服务器传输超⽂本 到本地浏览器的传送协议. 直⽩点⼉, 就是浏览器和服务器之间的数 据交互遵守的就是HTTP协议
包括请求和响应
请求头中最常⻅的⼀些重要内容(爬⾍需要): 1. User-Agent : 请求载体的身份标识(⽤啥发送的请求)
2. Referer: 防盗链(这次请求是从哪个⻚⾯来的? 反爬会⽤到)
3. cookie: 本地字符串数据信息(⽤户登录信息, 反爬的token)
响应头中⼀些重要的内容: 1. cookie: 本地字符串数据信息(⽤户登录信息, 反爬的token)
2. 各种神奇的莫名其妙的字符串(这个需要经验了, ⼀般都是token 字样, 防⽌各种攻击和反爬