• Celery 分布式任务队列 -- 基础入门


    Celery

    Celery 是什么

    Celery 是一个由 Python 编写的简单、灵活、可靠的用来处理大量信息的分布式系统,它同时提供操作和维护分布式系统所需的工具。

    Celery 专注于实时任务处理,支持任务调度。

    说白了,它是一个分布式队列的管理工具,我们可以用 Celery 提供的接口快速实现并管理一个分布式的任务队列。

    官方

    Celery 官网:http://www.celeryproject.org/

    Celery 官方文档英文版:http://docs.celeryproject.org/en/latest/index.html

    Celery 官方文档中文版:http://docs.jinkan.org/docs/celery/

    Celery架构

    Celery的架构由三部分组成,消息中间件(message broker)、任务执行单元(worker)和 任务执行结果存储(task result store)组成。

    消息中间件

    Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等

    任务执行单元

    Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。

    任务结果存储

    Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等

    使用场景

    异步执行:解决耗时任务

    延迟执行:解决延迟任务

    定时执行:解决周期(周期)任务

    celery框架

    """ 学习重点
    1)有独立的socket - 异步任务框架
    2)三部分组成,自己只提供worker,需要配合第三方提供broker,backend
    3)使用场景适用于:耗时任务、延迟任务、定时任务
    """
    

    Celery的安装配置

    pip install celery

    消息中间件:RabbitMQ/Redis

    app=Celery('任务名', broker='xxx', backend='xxx')

    Celery执行异步任务

    包架构封装

    project
        ├── celery_task  	# celery包
        │   ├── __init__.py # 包文件
        │   ├── celery.py   # celery连接和配置相关文件,且名字必须交celery.py
        │   └── tasks.py    # 所有任务函数
        ├── add_task.py  	# 添加任务
        └── get_result.py   # 获取结果
    

    基本使用

    异步任务

    celery.py
    # 1)创建app + 任务
    
    # 2)启动celery(app)服务:
    # 非windows
    # 命令:celery worker -A celery_task -l info
    # windows:
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
    
    # 3)添加任务:手动添加,要自定义添加任务的脚本,右键执行脚本
    
    # 4)获取结果:手动获取,要自定义获取任务的脚本,右键执行脚本
    
    
    from celery import Celery
    broker = 'redis://127.0.0.1:6379/1'
    backend = 'redis://127.0.0.1:6379/2'
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    tasks.py
    from .celery import app
    import time
    @app.task
    def add(n, m):
        print(n)
        print(m)
        time.sleep(10)
        print('n+m的结果:%s' % (n + m))
        return n + m
    
    @app.task
    def low(n, m):
        print(n)
        print(m)
        print('n-m的结果:%s' % (n - m))
        return n - m
    
    add_task.py
    # 异步任务:delay(a,b)   返回结果:result = async.get()  会将结果赋值给result进行使用
    from celery_task import tasks
    
    # 添加立即执行任务
    t1 = tasks.add.delay(10, 20)
    t2 = tasks.low.delay(100, 50)
    print(t1.id)
    
    # 查看返回结果
    from celery.result import AsyncResult
    id = 'afcb54ac-5e47-4324-9920-64dcd25038d2'   # redis中生成任务结果的id
    async = AsyncResult(id=id,app=app)
    t = async.get()  # 如果有异常,会重新抛出异常
    
    
    
    get_result.py
    from celery_task.celery import app
    
    from celery.result import AsyncResult
    
    id = '21325a40-9d32-44b5-a701-9a31cc3c74b5'
    if __name__ == '__main__':
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print('任务失败')
        elif async.status == 'PENDING':
            print('任务等待中被执行')
        elif async.status == 'RETRY':
            print('任务异常后正在重试')
        elif async.status == 'STARTED':
            print('任务已经开始被执行')
    

    延迟任务

    celery.py
    # 1)创建app + 任务
    
    # 2)启动celery(app)服务:
    # 非windows
    # 命令:celery worker -A celery_task -l info
    # windows:
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
    
    # 3)添加任务:手动添加,要自定义添加任务的脚本,右键执行脚本
    
    # 4)获取结果:手动获取,要自定义获取任务的脚本,右键执行脚本
    
    
    from celery import Celery
    broker = 'redis://127.0.0.1:6379/1'
    backend = 'redis://127.0.0.1:6379/2'
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    tasks.py
    from .celery import app
    import time
    @app.task
    def add(n, m):
        print(n)
        print(m)
        time.sleep(10)
        print('n+m的结果:%s' % (n + m))
        return n + m
    
    @app.task
    def low(n, m):
        print(n)
        print(m)
        print('n-m的结果:%s' % (n - m))
        return n - m
    
    add_task.py
    # 添加延迟任务:apply_async(args,eat)   args:参数  eat:时间
    # 必须在文件夹下新建一个create.py文件,将celery导入
    from datetime import datetime, timedelta
    eta=datetime.utcnow() + timedelta(seconds=10)
    tasks.low.apply_async(args=(200, 50), eta=eta)   # 将任务设置成延迟任务
    

    定时任务

    定时任务创建流程

    1.新建定时任务的文件夹,创建配置定时任务的包 -- celery_task
    2.将新建celery.py文件,在celery文件中配置app,时区,定时任务配置
    3.新建文件task.py,将需要进行的定时文件写在task.py文件中,在方法的开头写上@app.task
    4.使用启动命令启动celery.py文件
    5.定时任务开始执行,按照间隔的时间进行执行
    
    celery.py
    # 1)创建app + 任务
    
    # 2)启动celery(app)服务:
    # 非windows
    # 命令:celery worker -A celery_task -l info
    # windows:
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
    
    # 3)添加任务:自动添加任务,所以要启动一个添加任务的服务
    # 命令:celery beat -A celery_task -l info
    # -A:配置celery的文件名
    
    # 4)获取结果
    
    
    from celery import Celery
    
    broker = 'redis://127.0.0.1:6379/1'
    backend = 'redis://127.0.0.1:6379/2'
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    # include中的是需要进行定时任务的文件名
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    app.conf.beat_schedule = {
        'low-task': {
            'task': 'celery_task.tasks.low',
            'schedule': timedelta(seconds=3),
            # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
            'args': (300, 150),
        }
    }
    
    tasks.py
    from .celery import app
    
    import time
    @app.task
    def add(n, m):
        print(n)
        print(m)
        time.sleep(10)
        print('n+m的结果:%s' % (n + m))
        return n + m
    
    
    @app.task
    def low(n, m):
        print(n)
        print(m)
        print('n-m的结果:%s' % (n - m))
        return n - m
    
    
    get_result.py
    from celery_task.celery import app
    
    from celery.result import AsyncResult
    
    id = '21325a40-9d32-44b5-a701-9a31cc3c74b5'
    if __name__ == '__main__':
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print('任务失败')
        elif async.status == 'PENDING':
            print('任务等待中被执行')
        elif async.status == 'RETRY':
            print('任务异常后正在重试')
        elif async.status == 'STARTED':
            print('任务已经开始被执行')
    

    django中使用

    celery.py
    """
    celery框架django项目工作流程
    1)加载django配置环境
    2)创建Celery框架对象app,配置broker和backend,得到的app就是worker
    3)给worker对应的app添加可处理的任务函数,用include配置给worker的app
    4)完成提供的任务的定时配置app.conf.beat_schedule
    5)启动celery服务,运行worker,执行任务
    6)启动beat服务,运行beat,添加任务
    
    重点:由于采用了django的反射机制,使用celery.py所在的celery_task包必须放置项目的根目录下
    """
    
    # 一、加载django配置环境
    import os
    os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev")
    
    # 二、加载celery配置环境
    from celery import Celery
    # broker
    broker = 'redis://127.0.0.1:6379/0'
    # backend
    backend = 'redis://127.0.0.1:6379/1'
    # worker
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    app.conf.beat_schedule = {
        'django-task': {
            'task': 'celery_task.tasks.test_django_celery',
            'schedule': timedelta(seconds=3),
            'args': (),
        }
    }
    
    tasks.py
    from .celery import app
    # 获取项目中的模型类
    from api.models import Banner
    @app.task
    def test_django_celery():
        banner_query = Banner.objects.filter(is_delete=False).all()
        print(banner_query)
    
    

    总结

    关于使用celery的使用总结

    1.使用前安装模块

    pip install celery
    pip install eventlet
    

    2.启动中间件worker的指令

    """
    # 异步任务,延迟任务
    >>> celery worker -A 配置app的文件名 -i 打印日志等级 -P eventlet
    
    # 定时任务
    >>> celery beat -A 配置app的文件名 -i 打印日志等级
    """
    

    3.对需要使用celery方法进行装饰

    在每一个方法上加上 @app.task    app是导入本地自定义的app
    
    # 例:
    @app.task
    def add():
    

    4.本地自定义的celery配置文件

    from celery import Celery
    
    # 任务中间件(分发任务的)
    broker = 'redis://127.0.0.1:6379/0'
    # 任务结果仓库(保存任务结果的)
    backend = 'redis://127.0.0.1:6379/1'
    
    app = Celery(broker=broker,backend=backend,include=['celery_task.task','celery_task.ceshi'])
    # include:进行分发,列表为对应任务的文件夹
    

    5.定时任务配置

    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    app.conf.beat_schedule = {
        'add-task': {
            'task': 'celery_task.task.add',
            'schedule': timedelta(seconds=3),
            # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
            'args': (300, 150),
        },
        'low-task': {
            'task': 'celery_task.ceshi.low',
            'schedule': timedelta(seconds=6),
            # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
            'args': (300, 150),
        }
    }
    

    6.任务调用

    """
    1.异步任务:任务名.delay()
    
    2.延迟任务:任务名.apply_aysnc(eta='延迟时间')
    
    """
    

    7.对redis数据库中的数据进行反解

    from celery.result import AsyncResult
    id = 'afcb54ac-5e47-4324-9920-64dcd25038d2'
    async = AsyncResult(id=id,app=app)
    t = async.get()
    
    # 获取redis数据库中的信息
    

    8.异步延迟任务伪代码

  • 相关阅读:
    祝好,又十年
    关于简书的吐槽与思考还有杂七杂八负面情绪宣泄
    康威生命游戏———孤独会致命,拥挤也一样(转载)
    Bran的内核开发教程(bkerndev)-07 中断描述符表(IDT)
    Ubuntu安装QQ
    Bran的内核开发教程(bkerndev)-06 全局描述符表(GDT)
    Ubuntu安装scrcpy手机投屏和控制(Ubuntu用QQ微信的另一种方法)
    C、C++的Makefile模板
    C语言打印当前所在函数名、文件名、行号
    Bran的内核开发教程(bkerndev)-05 打印到屏幕
  • 原文地址:https://www.cnblogs.com/whkzm/p/12180091.html
Copyright © 2020-2023  润新知