Axios请求并发限制

Axios请求并发限制 - 简书 https://www.jianshu.com/p/d3529d18cf59

0.2352020.07.29 18:41:34字数 845阅读 6,213

背景

由于调用第三方服务的API的时候，第三方对请求的QPS会有一定的限制，如百度的人脸识别接口，QPS=5，腾讯地图开放平台的普通账号QPS=5，那么在使用的过程中如果每秒请求数超过此限制，接口就会返回报错。导致请求失败。因此，需要在本地实现QPS的控制，当把多个Axios的请求扔到Promise队列中的时候，不会导致请求超限的问题。

众所周知，Promise对象的运行并不是等调用Promise.all()的时候才会执行，而是在创建这个Promise的时候就已经开始执行了，所以从Promise这块去下手显然是无法实现的，需要在扔进Promise[]数组的这些Promise中去实现限制。

更多关于Promise并发等问题请自行学习了解，今天以Axios为例进行展开讨论。

开始

对于一个Axios请求来说返回一个Promise，这个大家都知道的哈~ 正常的Axios请求大概写成这样：

const AXIOS = require('axios')
async function AA() {
    let res = await AXIOS({
        method: 'GET',
        url: 'https://www.baidu.com'
    }).then(res => res.data)
    console.log(res)
}

如果需要100个并发请求，则可以利用Promise.all()来实现：

const AXIOS = require('axios')
async function BB() {
    // 定义一个Promise数组
    let pms = []
    for (let i = 0; i < 100; i++) {
        // 往pms中扔进去AXIOS返回的Promise对象们
        pms.push(AXIOS({
            method: 'GET',
            url: 'https://www.baidu.com'
        }).then(res => res.data).catch(err => console.error(err)))
    }
    // 通过Promise.all等待pms中所有的Promise执行完毕并返回结果给pms数组
    pms = await Promise.all(pms)
    console.log(pms)
}

首先，如上面所说，这个请求的Promise是在创建的时候就已经开始执行了（甚至还没push到pms[]中的时候它就已经在执行请求了）。所以如果百度这边的QPS限制为5，同一秒的前5个请求可能可以成功，但是后面的请求就都会因为并发数超限导致失败。当然，这里最简单的方法就是通过for循环进行限制，让for循环扔进去5个后就睡一会儿，睡到下一秒再继续扔5个就好了。比如像下面这样：

async function CC(QPS = 5) {
    const s = new Date().getTime()
    // 定义一个Promise数组
    let pms = []
    for (let i = 1; i <= 20; i++) {
        // 往pms中扔进去AXIOS返回的Promise对象们
        pms.push(AXIOS({
            method: 'GET',
            url: 'https://www.baidu.com'
        }).then(res => res.data).catch(err => console.error(err)))
        // 如果遇到QPS的倍数就歇1秒
        if (i % QPS == 0) await new Promise(r => setTimeout(() => {
            r()
        }, 1000))
    }
    // 通过Promise.all等待pms中所有的Promise执行完毕并返回结果给pms数组
    pms = await Promise.all(pms)
    console.log(pms)
    console.log('运行耗时：', new Date().getTime() - s)
}

上述方式是可以实现的，但是也有一定的弊端，比如可能涉及到修改的地方比较多，而且像是foreach这种迭代可能还不支持for循环中的sleep，那么今天我们就以Axios的特性来实现。

Axios的并发请求控制

在了解了Axios文档后得知，Axios有一个interceptors的拦截器机制，可以在发送请求前和请求结束返回前进行拦截，通过自定义函数实现消息的处理：【传送门】

那么我们是不是可以通过这个拦截器中实现sleep的方式去进行QPS控制呢？说干咱就干！

首先自定义一个interceptors函数：

let qpsMap = new Map()
const qpsController = (QPS = 5, OFFSET = 50) => async (config) => {
    const now = new Date().getTime()
    let {
        count,
        ts
    } = qpsMap.get(config.url) || {
        count: 1,
        ts: now
    }

    // console.log('Before', config.url, now, ts, count)
    // 对于Math.floor和parseInt来说，据说Math.floor性能更快
    if (Math.floor(now / 1000) <= Math.floor(ts / 1000)) {
        // 如果当前时间 ≤ Map中该接口的ts时间，说明前面已经有超过并发后在等待的请求了
        // 只比较秒，忽略毫秒，因为QPS是以秒为周期计算的，即每秒多少个请求数
        if (count < QPS) {
            // 如果当前url的请求数没有达到QPS的限制，则计数器+1
            count++
        } else {
            // 否则，重置计数器，同时将时间戳设置为当前ts的下一整秒
            // 这里需要将ts设置为当前ts的下一秒，而不是当前时间，因为当前ts可能已经远大于当前时间了
            ts = 1000 * (Math.floor(ts / 1000) + 1)
            count = 1
        }
    } else {
        // 否则：当前时间大于ts，说明已经没有排队的请求了（可能有未完成的，但是都已经请求了）
        // 则将当前ts重置
        ts = now
        count = 1
    }
    qpsMap.set(config.url, {
        count,
        ts
    })
    // console.log('After ', config.url, now, ts, count)

    // 计算休眠时间：
    // 由于本地服务器和远程服务器之间可能存在时间差会发生这种情况：
    // 前5个请求在10:00:00.200时发送过去后，此时本地时间可能到了10:00:00.900到来的第六请求由于超出了QPS=5的限制，会休眠100ms
    // 但是由于本地和服务端时间差的问题，第六个休眠100ms后发送了请求，服务端的时间可能才是10:00:00.950，导致了QPS超限报错
    // 所以，这里添加一个OFFSET偏移值来纠正本地和服务端之间的时间差问题，默认为50ms，若出现QPS超限，请酌情增大此值
    let sleep = ts - now
    sleep = sleep > 0 ? sleep + OFFSET : 0
    // console.log('Sleep Is', sleep)
    // 让当前的请求睡一会儿再请求
    await new Promise(resolve => setTimeout(() => resolve(), sleep))
    // 原封不动返回config，或做一些你自己的处理后返回
    return config
}

然后需要自定义一个AXIOS实例，并设置其request的interceptors为此函数：

async function BaiduClient(url = '', params = {}) {
    // 创建一个instance实例
    let instance = AXIOS.create({
        baseURL: 'http://www.baidu.com',
        timeout: 2000
    })
    // 配置本实例的interceptors为刚才的qpsController
    instance.interceptors.request.use(qpsController())

    return await instance.request({
        url,
        params
    }).then(response => response.status)
}

// 测试并发请求，并尝试优化qpsController(QPS,OFFSET)中的参数值
let pms = []
for(let i=0;i<=10;i++){
    pms.push(BaiduClient().then(res=>console.log(i, res)))
}
Promise.all(pms)

20200812版本更新

经过一段时间的学习，我们知道获取时间的时候通过Performance库效率更高，而且通过位运算进行取整比通过Math库效率高，同时将下一秒的计算由之前的下取整Math.floor改为了上取整Math.ceil，从而解决掉OFFSET问题。所以我们对qpsController函数进行如下改进：

// 引入Performance库来获取当前时间戳
const Performance = require('perf_hooks').performance
let qpsMap = new Map()
const qpsController = (QPS = 5, OFFSET = 0) => async (config) => {
    const now = Math.trunc(Performance.timeOrigin + Performance.now()) // Math.trunc(1597224439841.351)=1597224439841
    let {
        count,
        ts
    } = qpsMap.get(config.url) || {
        count: 1,
        ts: now
    }

    // console.log('Before', config.url, now, ts, (now / 1000) >> 0 <= (ts / 1000) >> 0, count)
    // 通过位运算实现取整，提高效率
    if ((now / 1000) >> 0 <= (ts / 1000) >> 0) {
        // 如果当前时间 ≤ Map中该接口的ts时间，说明前面已经有超过并发后在等待的请求了
        // 只比较秒，忽略毫秒，因为QPS是以秒为周期计算的，即每秒多少个请求数
        if (count < QPS) {
            // 如果当前url的请求数没有达到QPS的限制，则计数器+1
            count++
        } else {
            // 否则，重置计数器，同时将时间戳设置为当前ts的下一整秒
            // 这里需要将ts设置为当前ts的下一秒，而不是当前时间，因为当前ts可能已经远大于当前时间了
            // 这里修改以前的下取整为上取整，从而可以解决OFFSET问题
            ts = 1000 * Math.ceil(ts / 1000 + 1)
            count = 1
        }
    } else {
        // 否则：当前时间大于ts，说明已经没有排队的请求了（可能有未完成的，但是都已经请求了）
        // 则将当前ts重置
        ts = now
        count = 1
    }
    qpsMap.set(config.url, {
        count,
        ts
    })
    // console.log('After ', config.url, now, ts, count)

    // 计算休眠时间：
    // 由于本地服务器和远程服务器之间可能存在时间差会发生这种情况：
    // 前5个请求在10:00:00.200时发送过去后，此时本地时间可能到了10:00:00.900到来的第六请求由于超出了QPS=5的限制，会休眠100ms
    // 但是由于本地和服务端时间差的问题，第六个休眠100ms后发送了请求，服务端的时间可能才是10:00:00.950，导致了QPS超限报错
    // 所以，这里添加一个OFFSET偏移值来纠正本地和服务端之间的时间差问题，默认为0ms，若出现QPS超限，请酌情增大此值
    let sleep = ts - now
    sleep = sleep > 0 ? sleep + OFFSET : 0
    // console.log('Sleep Is', sleep)
    // 让当前的请求睡一会儿再请求
    await new Promise(resolve => setTimeout(() => resolve(), sleep))
    // 原封不动返回config，或做一些你自己的处理后返回
    return config

相关阅读:
python基础练习：
py+selenium切换到新弹出窗口通用方法
 Python 异常处理
 验证码自动化认证部分，可能由于分辨率导致截图不正确
 基于Tesseract的OCR图像识别
 Spark相关知识
 Hive和数据库除了拥有类似的查询语言，再无类似之处;关系型数据库和非关系型数据库的优缺点
 sed替换^A（01）,02,03等特殊字符
 Python操作adb命令脚本
 python从放弃到放弃
原文地址：https://www.cnblogs.com/rsapaper/p/16107359.html

Axios请求并发限制