• Celery异步任务框架


    Celery 官网:http://www.celeryproject.org/

    Celery 官方文档英文版:http://docs.celeryproject.org/en/latest/index.html

    Celery 官方文档中文版:http://docs.jinkan.org/docs/celery/

    Celery架构

    Celery的架构由三部分组成,消息中间件(message broker)、任务执行单元(worker)和 任务执行结果存储(task result store)组成。

    消息中间件

    Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等

    任务执行单元

    Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。

    任务结果存储

    Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等

    Celery的安装配置

    安装依赖:pip install celery

    消息中间件:RabbitMQ/Redis

    app=Celery('任务名', broker='xxx', backend='xxx')

    Celery执行异步任务

    包架构封装

    project
        ├── celery_task  	# celery包
        │   ├── __init__.py # 包文件
        │   ├── celery.py   # celery连接和配置相关文件,且名字必须交celery.py
        │   └── tasks.py    # 所有任务函数
        ├── add_task.py  	# 添加任务
        └── get_result.py   # 获取结果
    

    使用步骤

    '''
    1)创建app + 任务
    
    2)启动celery(app)服务:
        非windows
        cd 到celery_task所在文件夹下
        命令:celery worker -A celery_task -l info
    
        windows:
        安装依赖:pip3 install eventlet
        cd 到celery_task所在文件夹下
        命令:celery worker -A celery_task -l info -P eventlet
    
    3)手动添加任务:手动添加,要自定义添加任务的脚本,右键执行脚本
       自动任务:自动添加任务,所以要启动一个添加任务的服务
    	# 命令:celery beat -A celery_task -l info
    
    4)获取结果:手动获取,要自定义获取任务的脚本,右键执行脚本
    '''
    

    立即任务和延时任务

    celery_task文件夹-> celery.py (celery服务 文件名不可改)

    from celery import Celery
    
    # broker:任务仓库
    broker = 'redis://127.0.0.1:6379/1'
    # backend:任务结果仓库
    backend = 'redis://127.0.0.1:6379/2'
    # include:任务(函数)所在文件
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    

    celery_task文件夹-> tasks.py(celery任务 文件名可以改)

    from .celery import app
    import time
    @app.task
    def add(n, m):
        print(n)
        print(m)
        time.sleep(10)
        print('n+m的结果:%s' % (n + m))
        return n + m
    
    @app.task
    def low(n, m):
        print(n)
        print(m)
        print('n-m的结果:%s' % (n - m))
        return n - m
    

    add_task.py(添加任务)

    from celery_task import tasks
    
    # 往celery的Broker中添加立即任务
    t1 = tasks.add.delay(10, 20)
    t2 = tasks.low.delay(100, 50)
    print(t1.id)
    
    
    # 添加延迟任务
    
    from datetime import datetime, timedelta
    def eta_second(second):
        ctime = datetime.now()
        utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())
        time_delay = timedelta(seconds=second)
        return utc_ctime + time_delay
    
    # apply_async就是添加延迟任务
    # args是jump任务需要的参数,没有就设置为空()
    # eta是该任务执行的UTC格式的时间
    tasks.low.apply_async(args=(200, 50), eta=eta_second(10))
    

    get_result.py (获取任务执行结果)

    from celery_task.celery import app
    
    from celery.result import AsyncResult
    
    # 任务id
    id = '21325a40-9d32-44b5-a701-9a31cc3c74b5'
    if __name__ == '__main__':
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print('任务失败')
        elif async.status == 'PENDING':
            print('任务等待中被执行')
        elif async.status == 'RETRY':
            print('任务异常后正在重试')
        elif async.status == 'STARTED':
            print('任务已经开始被执行')
    

    定时任务

    celery_task文件夹-> celery.py (celery服务 文件名不可改)

    from celery import Celery
    
    broker = 'redis://127.0.0.1:6379/1'
    backend = 'redis://127.0.0.1:6379/2'
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 任务的定时配置
    from datetime import timedelta
    from celery.schedules import crontab
    app.conf.beat_schedule = {
        # 定时任务:任务名自定义
        'low-task': {
            'task': 'celery_task.tasks.low',	# 任务源
            'args': (300, 150),	# 任务参数
            'schedule': timedelta(seconds=3),	# 定时添加任务的时间
            # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
        }
    }
    

    celery_task文件夹-> tasks.py(celery任务 文件名可以改)

    from .celery import app
    
    import time
    @app.task
    def add(n, m):
        print(n)
        print(m)
        time.sleep(10)
        print('n+m的结果:%s' % (n + m))
        return n + m
    
    
    @app.task
    def low(n, m):
        print(n)
        print(m)
        print('n-m的结果:%s' % (n - m))
        return n - m
    

    get_result.py

    from celery_task.celery import app
    
    from celery.result import AsyncResult
    
    id = '21325a40-9d32-44b5-a701-9a31cc3c74b5'
    if __name__ == '__main__':
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print('任务失败')
        elif async.status == 'PENDING':
            print('任务等待中被执行')
        elif async.status == 'RETRY':
            print('任务异常后正在重试')
        elif async.status == 'STARTED':
            print('任务已经开始被执行')
    

    启动定时任务:

    '''
    进入celery_tash的父级目录
    
    启动celery(app)服务:
     非windows
      命令:celery worker -A celery_task -l info
     windows:
      pip3 install eventlet
      celery worker -A celery_task -l info -P eventlet
    
    添加任务:自动添加任务,所以要启动一个添加任务的服务
      命令:celery beat -A celery_task -l info
    '''
    

    使用场景

    立即任务:将耗时操作任务提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等等

    延时任务:需要延时处理的任务丢到延时任务里取处理

    定时任务:定时执行某件事情,比如每天数据统计

    django项目中使用

    # 1)创建app + 任务
    
    # 2)启动celery(app)服务:
    # 非windows
    # 命令:celery worker -A celery_task -l info
    # windows:
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
    
    # 3)添加任务:自动添加任务,所以要启动一个添加任务的服务
    # 命令:celery beat -A celery_task -l info
    
    # 4)获取结果
    

    celery.py(celery服务)

    # 重点:要将 项目的配置文件 所在的文件夹添加到环境变量
    # import sys
    # sys.path.append(r'项目的配置文件所在的文件夹')
    
    # 开启django支持
    import os
    os.environ.setdefault('DJANGO_SETTINGS_MODULE', '项目名.settings.dev')
    import django
    django.setup()
    
    
    from celery import Celery
    
    # broker:任务仓库
    broker = 'redis://127.0.0.1:6379/1'
    # backend:任务结果仓库
    backend = 'redis://127.0.0.1:6379/2'
    # include:任务(函数)所在文件
    app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
    
    
    # 时区
    app.conf.timezone = 'Asia/Shanghai'
    # 是否使用UTC
    app.conf.enable_utc = False
    
    # 自动任务的定时配置
    from celery.schedules import crontab
    from datetime import timedelta
    app.conf.beat_schedule = {
        # 定时任务:任务名自定义
        'update_banner_cache': {
            'task': 'celery_task.tasks.update_banner_cache',  # 任务源
            'args': (),  # 任务参数
            'schedule': timedelta(seconds=10), # 定时添加任务的时间
            # 'schedule': crontab(hour=8, day_of_week=1),  # 每周一早八点
        }
    }
    

    tasks.py(任务)

    from .celery import app
    # 获取项目中的模型类
    from home.models import Banner
    from django.conf import settings
    from django.core.cache import cache
    from home.serializers import BannerModelSerializer
    @app.task
    def update_banner_cache():
        # 查询数据库
        banner_query = Banner.objects.filter(is_delete=False, is_show=True).order_by("-order")[:settings.BANNER_COUNT]
        # 序列化数据对象得到序列化后的json列表
        banner_list = BannerModelSerializer(banner_query, many=True).data
        # 设置缓存,走的是默认项目配置的缓存数据库
        cache.set('banner_list', banner_list)
    

    坑点:

    windows下celery处理post请求会报错。

    错误:wrap_socket() got an unexpected keyword argument '_context'

    原因:

    启动服务器错误
    requests包的requests.post发送后,传不回数据

    改变服务器启动方法不要用eventlet,加个参数
    celery worker -A celery_name --loglevel=info --pool=solo

  • 相关阅读:
    sizzle编译函数
    人人都是 DBA(XII)查询信息收集脚本汇编
    人人都是 DBA(XI)I/O 信息收集脚本汇编
    人人都是 DBA(X)资源信息收集脚本汇编
    人人都是 DBA(IX)服务器信息收集脚本汇编
    人人都是 DBA(VIII)SQL Server 页存储结构
    人人都是 DBA(VII)B 树和 B+ 树
    人人都是 DBA(VI)SQL Server 事务日志
    人人都是 DBA(V)SQL Server 数据库文件
    人人都是 DBA(IV)SQL Server 内存管理
  • 原文地址:https://www.cnblogs.com/XuChengNotes/p/12019811.html
Copyright © 2020-2023  润新知