一、celery介绍
1. 什么是celery
- Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统
- 专注于实时处理的异步任务队列
- 同时也支持任务调度
- celery单独使用一个socket,不会额外占用其他程序的资源。
- 项目中使用celery的优势
- 减少服务器的压力
- 提供了3中任务的执行方式
2. celery架构
Celery的架构由三部分组成,消息中间件(message broker)、任务执行单元(worker)和 任务执行结果存储(task result store)组成。
celery的架构图
(1)消息中间件
- celery本身不提供消息服务,但是可以和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等
(2)任务执行单元
- worker是celery提供的任务执行单元,worker并发的运行在分布式系统节点中
(3)任务结果存储
- Task result store用来存储worker执行的任务结果,celery支持以不同方式存储任务的结果,包括AMQP,redis等
3. celery的使用场景
- celery中共提供了3中任务执行的方式,分别应用于3个场景
- 异步执行
- 延迟执行
- 定时执行
(1)异步执行
- 异步的执行分配的任务
(2)延迟执行
- 就是在之后的某一个时间点,执行该指定的任务
(3)定时执行
- 解决周期任务(就是周期的执行某一个任务)
4. celery的安装
''' pip install celery 消息中间件使用:RabbitMQ/Redis '''
二、celery的使用
1. celery基本使用介绍
(1)项目中celery的文件结构
project ├── celery_task # celery包 │ ├── __init__.py # 包文件 │ ├── celery.py # celery连接和配置相关文件,且名字必须叫celery.py │ └── tasks.py # 所有任务函数 ├── add_task.py # 添加任务 └── get_result.py # 获取结果
(2)celery的基本使用方法
步骤: 1. 在celery.py中配置broker,backend和Celery对象(进行Celery对象实例化时,将任务文件传入) 2. 在任务文件task.py中,定义任务函数,任务函数要装饰上上面生成的 Celery对象.task 这个装饰器 3. 在add_task.py文件中,为task.py文件中定义的任务函数,添加执行方式(异步/延迟/定时) 4. 在get.result.py文件中,可以定义结果,查看任务执行的结果,但是一般这些任务的执行结果不必要查看,所以这一步可做可不做 5. 启动celery服务 6. 获取结果
2. celery的基本使用实例
(1)celery.py
文件中
# 1)创建Celery对象 + 任务 # 2)启动celery(app)服务: # 非windows # 命令:celery worker -A celery_task -l info # windows: # pip3 install eventlet # celery worker -A celery_task -l info -P eventlet # 3)添加任务:手动添加,要自定义添加任务的脚本,右键执行脚本 # 4)获取结果:手动获取,要自定义获取任务的脚本,右键执行脚本 from celery import Celery broker = 'redis://127.0.0.1:6379/1' backend = 'redis://127.0.0.1:6379/2' app = Celery(broker=broker, backend=backend, include=['celery_task.tasks'])
(2)task.py
文件中
from .celery import app import time @app.task def add(n, m): print(n) print(m) time.sleep(10) print('n+m的结果:%s' % (n + m)) return n + m @app.task def low(n, m): print(n) print(m) print('n-m的结果:%s' % (n - m)) return n - m
(3)add_task.py
文件中
from celery_task import tasks # 添加立即执行任务 t1 = tasks.add.delay(10, 20) t2 = tasks.low.delay(100, 50) print(t1.id) # 添加延迟任务 from datetime import datetime, timedelta eta=datetime.utcnow() + timedelta(seconds=10) tasks.low.apply_async(args=(200, 50), eta=eta)
(4)get_result.py
文件中
from celery_task.celery import app from celery.result import AsyncResult id = '21325a40-9d32-44b5-a701-9a31cc3c74b5' if __name__ == '__main__': async = AsyncResult(id=id, app=app) if async.successful(): result = async.get() print(result) elif async.failed(): print('任务失败') elif async.status == 'PENDING': print('任务等待中被执行') elif async.status == 'RETRY': print('任务异常后正在重试') elif async.status == 'STARTED': print('任务已经开始被执行')
3. Celery的高级使用
(1)celery.py
文件中
步骤: # 1)创建Celery对象 + 任务 # 2)启动celery(app)服务: # 非windows # 命令:celery worker -A celery_task -l info # windows: # pip3 install eventlet # celery worker -A celery_task -l info -P eventlet # 3)添加任务:自动添加任务,所以要启动一个添加任务的服务 # 命令:celery beat -A celery_task -l info # 4)获取结果 from celery import Celery broker = 'redis://127.0.0.1:6379/1' backend = 'redis://127.0.0.1:6379/2' app = Celery(broker=broker, backend=backend, include=['celery_task.tasks']) # 下面这两个时间的配置,只要写一个就可以了 # 时区 app.conf.timezone = 'Asia/Shanghai' # 是否使用UTC app.conf.enable_utc = False # 这个为False,则走django项目的settings文件的国际化配置 # 任务的定时配置 from datetime import timedelta from celery.schedules import crontab app.conf.beat_schedule = { 'low-task': { 'task': 'celery_task.tasks.low', 'schedule': timedelta(seconds=3), # 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点 'args': (300, 150), } }
(2)task.py
文件中
from .celery import app import time @app.task def add(n, m): print(n) print(m) time.sleep(10) print('n+m的结果:%s' % (n + m)) return n + m @app.task def low(n, m): print(n) print(m) print('n-m的结果:%s' % (n - m)) return n - m
(3)get_result.py
文件中
from celery_task.celery import app from celery.result import AsyncResult id = '21325a40-9d32-44b5-a701-9a31cc3c74b5' if __name__ == '__main__': async = AsyncResult(id=id, app=app) if async.successful(): result = async.get() print(result) elif async.failed(): print('任务失败') elif async.status == 'PENDING': print('任务等待中被执行') elif async.status == 'RETRY': print('任务异常后正在重试') elif async.status == 'STARTED': print('任务已经开始被执行')
4. django项目中celery的使用
- 使用celery做轮播图的硬盘数据库同步到缓存
(1)步骤
""" 前提:将celery文件夹创建在项目根目录下 celery框架django项目工作流程 1)加载django配置环境 2)创建Celery框架对象app,配置broker和backend,得到的app就是worker 3)给worker对应的app添加可处理的任务函数,用include配置给worker的app 4)完成提供的任务的定时配置app.conf.beat_schedule 5)启动celery服务,运行worker,执行任务 6)启动beat服务,运行beat,添加任务 重点:由于采用了django的反射机制,使用celery.py所在的celery_task包必须放置项目的根目录下 """
(2)celery.py
文件中
# 一、加载django配置环境 import os os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev") # 二、加载celery配置环境 from celery import Celery # broker broker = 'redis://127.0.0.1:6379/0' # backend backend = 'redis://127.0.0.1:6379/1' # worker app = Celery(broker=broker, backend=backend, include=['celery_task.tasks']) # 时区 app.conf.timezone = 'Asia/Shanghai' # 是否使用UTC app.conf.enable_utc = False # 定时任务配置 from datetime import timedelta from celery.schedules import crontab app.conf.beat_schedule = { # 'add-task': { # 'task': 'celery_task.tasks.add', # 'schedule': timedelta(seconds=3), # # 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点 # 'args': (20, 10), # }, # 'low-task': { # 'task': 'celery_task.tasks.low', # 'schedule': timedelta(seconds=6), # 'args': (20, 10), # }, # 'get-users-task': { # 'task': 'celery_task.tasks.get_users', # 'schedule': timedelta(seconds=3), # 'args': (), # }, # 案例:django异步更新缓存 'update-banner-cache': { 'task': 'celery_task.tasks.update_banner_cache', 'schedule': timedelta(seconds=10), 'args': (), }, }
(3)task.py
文件中
from .celery import app from user.models import User # 测试django环境下的任务 @app.task def get_users(): user_list = User.objects.all() print(user_list) return True # 伪代码:立即和延迟任务使用 @app.task def send_email(user, content): result = print('对user发送content邮件内容') if not result: print('短信推送用户,邮件发送失败') return False return True # 案例:django异步更新缓存 from home.models import Banner from django.conf import settings from django.core.cache import cache from home.serializers import BannerModelSerializer @app.task def update_banner_cache(): banner_query = Banner.objects.filter(is_delete=False, is_show=True).order_by('-orders').all()[:settings.BANNER_COUNT] banner_data = BannerModelSerializer(banner_query, many=True).data for banner in banner_data: banner['image'] = "%s%s" % (settings.BASE_URL, banner.get('image')) cache.set('banner_cache', banner_data) return True
来源:https://www.cnblogs.com/Mcoming/p/12178255.html