24-移动端app数据爬取

移动端数据爬取

安装fiddler

在这里插入图片描述

真机安装fiddler证书

在这里插入图片描述

修改手机代理（改成电脑ip，端口设置为fiddler的端口）

在这里插入图片描述

上述设置完成后我们就可以使用fiddler抓取手机端的数据了

在这里插入图片描述

夜神手机模拟器

在这里插入图片描述

移动端数据采集-案例一

找到数据接口
在这里插入图片描述

# -*- coding: utf-8 -*-
import requests
from lxml import etree
import json

url = "https://api.douguo.net/recipe/v2/search/0/20"
headers = {
   "User-Agent":"Mozilla/5.0 (Linux; Android 5.1.1; LIO-AN00 Build/LIO-AN00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/74.0.3729.136 Mobile Safari/537.36",
    "Cookie":"duid=65861350",
    "uuid": "feccc21d-d04b-466c-b276-98c6a7e1acef",
    "Host":"api.douguo.net",
    "language":"zh"
}
data = {
    "client": "4",
    "_session": "1599663959153866174309718910",
    "keyword": "下饭菜",
    "order": "0",
    "_vs": "400",
    "type": "0",
    "auto_play_mode": "2",
    "sign_ran": "9ce91f215449bf78a75a4a147d6bcc43",
}
response = requests.post(url=url,headers=headers,data=data).text
response2 = json.loads(response)
print(response2)

最后我只需要使用字典提取自己需要的数据就行
在这里插入图片描述
带翻页源码

# -*- coding: utf-8 -*-
import requests
from lxml import etree
import json

#通过滑动app分析得知每页 20递增
#第一页 https://api.douguo.net/recipe/v2/search/0/20
# 第二页  https://api.douguo.net/recipe/v2/search/20/20
# 第三页 https://api.douguo.net/recipe/v2/search/40/20
# 第四页 https://api.douguo.net/recipe/v2/search/60/20
# 依次递增
# 定义通用翻页模板
url = "https://api.douguo.net/recipe/v2/search/%d"+"/20"
for pg in range(0,100,20):
    new_url = format(url%pg)
    headers = {
       "User-Agent":"Mozilla/5.0 (Linux; Android 5.1.1; LIO-AN00 Build/LIO-AN00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/74.0.3729.136 Mobile Safari/537.36",
        "Cookie":"duid=65861350",
        "uuid": "feccc21d-d04b-466c-b276-98c6a7e1acef",
        "Host":"api.douguo.net",
        "language":"zh"
    }
    data = {
        "client": "4",
        "_session": "1599663959153866174309718910",
        "keyword": "下饭菜",
        "order": "0",
        "_vs": "400",
        "type": "0",
        "auto_play_mode": "2",
        "sign_ran": "9ce91f215449bf78a75a4a147d6bcc43",
    }
    response = requests.post(url=new_url,headers=headers,data=data).text
    response2 = json.loads(response)
    print(response2)

相关阅读:
好记性不如烂笔头，要经常把学习的东西记录下来
 liunx git 已经设置了ssh key 还是需要帐号和密码的解决方法。
解决composer ssl required for SSL/TLS 证书配置
 composer SSL: Handshake timed out 解决办法
 小程序解密报错：IV passed is 24 bytes long which is longer than the 16 expected by se
PHP面向对象试题（基础部分）
php 单例模式
 在Thinkphp里面加入验证码插件
 phpstorm 修改默认注释
 用PHP去掉文件头的Unicode签名（BOM）
原文地址：https://www.cnblogs.com/gemoumou/p/13643053.html