Celery 官网:Celery - Distributed Task Queue — Celery 5.2.7 documentation
Celery 官方文档英文版:Celery - Distributed Task Queue — Celery 5.2.7 documentation
# celery:芹菜,一个分布式的异步任务框架。
⭐celery能干什么:异步任务,延迟任务,定时任务。
-异步执行:解决耗时任务,将“耗时操作任务”提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等。
-延迟执行:解决延迟任务。
-定时执行:解决周期(周期)任务,比如每天数据统计。
"""
1)可以不依赖任何服务器,通过自身命令,启动服务。
2)celery服务为其他项目服务提供“异步处理任务”的功能。
注:有两个服务同时运行,一个是项目服务,一个是celery服务。项目服务将“需要异步处理的任务”交给celery服务,celery会在需要时异步完成项目的需求。
人是一个独立运行的服务。 | 医院也是一个独立运行的服务。
正常情况下,人可以完成所有健康情况的动作,不需要医院的参与;但当人生病时,就会被医院接收,解决人生病问题。
人生病的处理方案交给医院来解决,所有人不生病时,医院独立运行;人生病时,医院就来解决人生病的需求。
"""
Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues related to that platform.
Sanic:python3.5以上,不支持win。
-选择使用mac开发
-装ubuntu
-win远程连接linux开发
uwgi(不支持win)+ django
celery架构中的几个主要组件为:
消息中间件(broker): Celery本身不提供消息服务,但是可以方便地和第三方提供的消息中间件集成,包括 Redis 等。
任务执行单元(worker): Worker是Celery提供的任务执行的单元,并发运行在分布式的系统节点中(本质:一个work就是一个进程)。
任务结果存储(backend): Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括 redis 等。
Celery异步任务框架,是一个独立运行的服务(内置socket)。
使用Celery框架的步骤为:
1.安装Celery框架环境,启动Celery服务(需要提前配置Broker和Backend);
2.手动或自动添加任务到Broker中,Worker就会自动在后台异步执行任务;
3.从Backend中获取任务执行结果。
Celery具体工作流程如下图所示:
# 安装:
pip install celery
# window 上启动 work
## 4.x版本及之前
pip install eventlet
celery worker -A celery_task -l info -P eventlet
## 5.x版本
pip install eventlet
celery -A celery_task worker -l info -P eventlet
# linux 中启动 work
celery worker -A celery_task -l info
celery -A celery_task worker -l info
# 启动 beat 的命令(负责每隔几秒钟,向任务队列中提交任务)
celery beat -A celery_task -l info
两种celery任务结构:一种是放在模块下,另一种是放在包下。提倡用包管理,结构更清晰。
如果 Celery对象:Celery(...) 放在一个模块下,则:
1)终端切换到该模块所在文件夹位置:scripts
2)执行启动worker的命令:celery worker -A 模块名 -l info -P eventlet
注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
注:模块名随意。
如果 Celery对象:Celery(...) 放在一个包下,则:
1)必须在这个包下建一个celery.py的文件,将Celery(...)产生对象的语句放在该文件中
2)执行启动worker的命令:celery worker -A 包名 -l info -P eventlet
注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
注:包名随意。
新建celery_task.py
from celery import Celery
backend='redis://127.0.0.1:6379/1' # 结果存储
broker='redis://127.0.0.1:6379/2' # 消息中间件
# app=Celery(‘任务名’, broker=’xxx’, backend=’xxx’)
app=Celery('test', broker=broker, backend=backend) # 传一个字符串,相当于名字
@app.task
def add(a, b): # 很耗时的任务
import time
time.sleep(3)
return a + b
新建add_task.py添加任务
from celery_task import add
# res=add(1, 2) # 同步调用
res=add.delay(3,4) # 把任务提交到redis,系统返回任务uuid:b20f827d-dcf5-4fdf-a646-5abb963dc1d3
print(res)
新建get_result.py查询任务
from celery_task import app # 自己写的app
from celery.result import AsyncResult # celery模块下的
id = 'b20f827d-dcf5-4fdf-a646-5abb963dc1d3'
if __name__ == '__main__':
a = AsyncResult(id=id, app=app)
if a.successful():
result = a.get() # task中return的数据:7
print(result)
elif a.failed():
print('任务失败')
elif a.status == 'PENDING':
print('任务等待中,尚未被执行')
elif a.status == 'RETRY':
print('任务异常后正在重试')
elif a.status == 'STARTED':
print('任务已经开始被执行')
启动worker
# windows中启动work
pip install eventlet
celery -A celery_task worker -l info -P eventlet
# linux中启动work
celery -A celery_task worker -l info
celery_task # 包名
├── __init__.py # 包初始化文件
├── user_task.py # 任务存放路径
├── order_task.py # 任务存放路径
├── home_task.py # 任务存放路径
└── celery.py # app所在文件,celery连接和配置相关文件,必须叫celery.py
add_task.py # 别的服务提交任务
get_result.py # 别的服务获取结果
celery.py 文件
### 有app的这个py文件,必须叫celery
from celery import Celery
backend = 'redis://127.0.0.1:6379/1' # 结果存储
broker = 'redis://127.0.0.1:6379/2' # 消息中间件
app = Celery('test', broker=broker, backend=backend, include=[
'celery_task.home_task',
'celery_task.order_task',
'celery_task.user_task'
])
# 定制定时任务
# 时区(修改时区)
print(app.conf)
app.conf.timezone = 'Asia/Shanghai'
# 是否使用UTC
app.conf.enable_utc = False
# 任务的定时配置
from datetime import timedelta
from celery.schedules import crontab
app.conf.beat_schedule = {
'send_sms_5': {
'task': 'celery_task.user_task.send_sms', # 要执行的任务
'schedule': timedelta(seconds=5),
# 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
'args': (189533333,),
},
'add_3': {
'task': 'celery_task.home_task.add', # 要执行的任务
'schedule': timedelta(seconds=3),
# 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
'args': (6,8),
}
}
home_task.py 文件
from .celery import app
@app.task # home模块的任务
def add(a,b):
return a+b
order_task.py 文件
from .celery import app
@app.task # order模块的任务,写文件任务
def write_file(s):
with open(r'./test/log/a.txt','w', encoding='utf-8') as f:
f.write(s)
return True
user_task.py
from .celery import app
@app.task # user模块的任务, 发送短信
def send_sms(s):
import time
time.sleep(3)
return '%s手机号,短信发送成功'%s
from celery_task.user_task import send_sms
res=send_sms.delay('18953675221')
print(res)
# 延迟任务,延迟5s钟后,发送短信
from celery_task.user_task import send_sms
from datetime import datetime, timedelta
# print(datetime.utcnow()+timedelta(seconds=10)) # 打印出当前utc时间
eta=datetime.utcnow() + timedelta(seconds=10) # 当前utc时间,往后推10s,时间对象
# # args是列表,send_sms的参数,eta是延迟时间,时间对象
res=send_sms.apply_async(args=['1888888',], eta=eta)
print(res)
# 在celery.py中配置
# 修改时区配置
# 时区
app.conf.timezone = 'Asia/Shanghai'
# 是否使用UTC
app.conf.enable_utc = False
# 任务的定时配置
from datetime import timedelta
from celery.schedules import crontab
app.conf.beat_schedule = {
# 定时任务一,每隔3秒做一次
'task-mul': {
'task': 'celery_task.user_task.mul',
'schedule': timedelta(seconds=3), # 3s后
# 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
'args': (3, 15),
},
# 定时任务二,每隔10秒做一次
'task-add': {
'task': 'celery_task.home_task.add',
'schedule': timedelta(seconds=10), # 10s后
# 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
'args': (3, 5),
},
}
# 启动beat(beat负责定时提交任务)
celery beat -A celery_task -l info
# 启动worker,任务就会被worker执行了
celery -A celery_task worker -l info -P eventlet
# django-celery模块,年久失修
-django-celery
-django
-celery
# 自己集成(跟框架无关)
1 如果mysql数据变化了,轮播图表数据变化了,由于缓存没有更新,就会出现问题。
2 双写一致性问题
-因为使用了缓存,mysql和redis的数据不一致了。
-如何解决:(缓存更新策略)
-加入过期时间? 60s? 过期时间内数据还有问题。
-定时更新缓存(每隔60s,更新一下缓存)
-数据库一更改,立马改缓存。
-先改数据库,再改缓存。
-先改缓存,再改数据库。
-数据库一改,删除缓存。
-先删缓存,再改数据库。
-先改数据库,再删缓存(稍微好一些)。
3 首页轮播图接口:缓存更新策略是定时更新。
-celery的定时任务。
-使用celery的定时任务,完成首页轮播图缓存的更新。
celery消费任务不执行或者报错NotRegistered,与很多方面有关系。在排查错误时,要从以下6方面着手:
1) 整个项目目录结构:celery的目录结构和任务函数位置,有很大影响。
2) @task入参:用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同,建议主动设置这个名字,对函数名字和所处位置依赖减小。
3) celery的配置task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes)。
4) celery的配置 include (在3.xx叫 CELERY_INCLUDE)或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参。
5) cmd命令行启动参数 --queues= 的值。
6) 用户在启动cmd命令行时候,用户所在的文件夹。
在不规范的文件夹路径下,使用celery难度很高,一般教程都没教。
[项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。
国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ,
从用法调用难度,用户所需代码量,超高并发性能,qps控频精确程度,支持的中间件类型,任务控制方式,稳定程度等19个方面,全方位超过celery,任何方面都是有过之而无不及。如果读者时间充裕,可以自行研究使用。