Celery 官方文档英文版:http://docs.celeryproject.org/en/latest/index.html
Celery 官方文档中文版:http://docs.jinkan.org/docs/celery
Celery 是一个由 Python 编写的简单、灵活、可靠的用来处理大量信息的分布式系统,它同时提供操作和维护分布式系统所需的工具。Celery 专注于实时任务处理,支持任务调度。说白了,它是一个分布式队列的管理工具,我们可以用 Celery 提供的接口快速实现并管理一个分布式的任务队列。
Celery(芹菜)用于生产系统每天处理数以百万计的任务。Celery是用Python编写的,但该协议可以在任何语言实现。它也可以与其他语言通过webhooks实现。Celery建议的消息队列是RabbitMQ,但提供有限支持Redis, Beanstalk, MongoDB, CouchDB, 和数据库(使用SQLAlchemy的或Django的 ORM) 。Celery是易于集成Django, Pylons and Flask,使用 django-celery, celery-pylons and Flask-Celery 附加包即可。
Celery的架构组成如下图:
可以看到,Celery 主要包含以下几个模块:
1:任务模块 Task
包含异步任务和定时任务。其中,异步任务通常在业务逻辑中被触发并发往任务队列,而定时任务由 Celery Beat 进程周期性地将任务发往任务队列。
2:消息中间件 Broker
Broker,即为任务调度队列,接收任务生产者发来的消息(即任务),将任务存入队列。Celery 本身不提供队列服务,官方推荐使用 RabbitMQ 和 Redis 等。
3:任务执行单元 Worker
Worker 是执行任务的处理单元,它实时监控消息队列,获取队列中调度的任务,并执行它。
4:任务结果存储 Backend
Backend 用于存储任务的执行结果,以供查询。同消息中间件一样,存储也可使用 RabbitMQ, Redis 和 MongoDB 等。
应用场景一:我们知道大型网站的性能非常重要,然而有时不得不做一些相当耗时的操作。 比如SNS网站的“新鲜事儿”系统,我发帖之后,会给所有关注我的人推送一条通知。乍一看没什么难的,发帖之后找出关注我的人, 然后生成相应的消息记录就行了。但问题是,100个人关注我,就要执行100条INSERT查询,更要命的是,Web服务器是同步的, 这100条查询执行完成之前,用户是看不到结果的。怎么办呢,这时就轮到消息队列上场了。发帖之后只需给队列发送一条消息, 告诉队列“我发帖子了”,然后把发帖的结果返回给用户。 这时另一个叫做worker的进程会取出这条消息并执行那100条INSERT查询。这样,推送通知的操作在后台异步执行, 用户就能立即看到发帖结果。更精彩的是,可以运行多个worker实现分布式,多繁重的任务都不在话下了。将Celery 与RabbitMQ 结合,将会产出很好的效果,可以实现类似新浪微博大数据量的消息推送。(这里就可以采用RabbitMQ消息队列系统负责存储消息;采用celery的worken进程,同时提供在webapp中创建任务的功能)。
应用场景二:很多做开发和运维的都会涉及一件事:crontab, 也就是在服务器上设定定时任务,按期执行一些任务.但是假如你有上千台的服务器, 你有上千种任务,那么对于这个定时任务的管理恐怕是一件很头疼的事情.哪怕你只是几十个任务分配的不同的机器上怎么样合理的管理和实现以下功能呢:
①查看定时任务的执行情况.比如执行是否成功,当前状态,执行花费的时间;
②一个友好的界面或者命令行下实现添加,删除任务;
③怎么样简单实现不同的机器设定不同种任务,某些机器执行不同的队列;
④假如你需要生成一个任务怎么样不阻塞剩下来的过程(异步了呗);
⑤怎么样并发的执行任务。
RabbitMQ,ZeroMQ这样的消息队列总是出现在我们视线中, 其实意义是很简单: 消息就是一个要传送的数据,celery是一个分布式的任务队列.这个”任务”其实就是一种消息, 任务被生成到队列中,被RabbitMQ等容器接收和存储,在适当的时候又被要执行的机器把这个消息取走。
以上是两种典型的应用场景。通过上面两种场景的分析,在大量异步任务处理和大量定时任务管理的情况下,我们可以优先考虑采用celery和rabbitMq解决这些问题。
简单:Celery 易于使用和维护,并且它不需要配置文件
高可用性:倘若连接丢失或失败,进程和客户端会自动重试,并且通过主/主或主/从方式复制来提高可用性
快速:单个 Celery 进程每分钟可处理数以百万计的任务,而保持往返延迟在亚毫秒级
灵活:Celery 几乎所有部分都可以扩展或单独使用。可以自制连接池、序列化、压缩模式、日志、调度器、消费者、生产者、自动扩展、中间人传输或更多。
它的基本工作就是管理分配任务到不同的服务器,并且取得结果。至于说服务器之间是如何进行通信的?这个Celery本身不能解决。所以,RabbitMQ作为一个消息队列管理工具被引入到和Celery集成,负责处理服务器之间的通信任务。和rabbitmq的关系只是在于,celery没有消息存储功能,他需要介质,比如rabbitmq、redis、mysql、mongodb 都是可以的。推荐使用rabbitmq,他的速度和可用性都很高。
# 安装celery
pip install -U Celery
在django工程目录下新建一python包,名为celery_tasks,整个目录结构如下:
目录结构说明:
sms/tasks.py文件内容如下:
from celery_tasks.main import celery_app
from celery_tasks.sms.yuntongxun.ccp_sms import CCP
from . import constants
@celery_app.task(name = 'send_sms_code') # name为给任务取个任务名
def send_sms_code(mobile, sms_code):
result = CCP().send_template_sms(mobile, [sms_code, constants.SMS_CODE_REDIS_EXPIRES // 60], constants.SEND_SMS_TEMPLATE_ID)
return result # 0 or -1
config.py文件内容如下:
# Celery configuration file
broker_url = 'redis://:[email protected]:10009/10' # xxx为redis密码
main.py入口文件内容如下:
from celery import Celery
# Celery entry file
celery_app = Celery('meiduo')
# Load configuration
celery_app.config_from_object('celery_tasks.config') # 加载配置文件
# register tasks
celery_app.autodiscover_tasks(['celery_tasks.sms']) # 注册task
启动celery:
celery_tasks目录的绝对路径为:/root/pywwwroot/meiduo/celery_tasks,进入到/root/pywwwroot/meiduo目录下,执行以下命令:
celery -A celery_tasks.main worker -l info
# -A指对应的应用程序, 其参数是项目中 Celery实例的位置。
# worker指这里要启动的worker。
# -l指日志等级,比如info等级。
如下图所示表示启动成功,注意第一行的提示大意为不要使用root用户运行celery
Django视图类中调用该任务:
class SMSCodeView(View):
def get(self, request, mobile):
forms = ImageCodeForm(request.GET)
if not forms.is_valid():
errors = forms.get_errors()
return http.JsonResponse({'code': RETCODE.IMAGECODEERR, 'errmsg': errors})
send_flag = redis_get_data('verify_code', 'send_flag_%s' % mobile)
if send_flag:
return http.JsonResponse({'code': RETCODE.THROTTLINGERR, 'errmsg': 'Only one SMS can be sent within 60 seconds'})
sms_code = '%06d' % random.randint(0, 999999)
logger.info(sms_code)
redis_save_data('verify_code', 'sms_%s' % mobile, constants.SMS_CODE_REDIS_EXPIRES, sms_code)
redis_save_data('verify_code', 'send_flag_%s' % mobile, constants.SEND_SMS_CODE_INTERVAL, 1)
send_sms_code.delay(mobile, sms_code) # 调用celery任务
return http.JsonResponse({'code': RETCODE.OK, 'errmsg': 'send SMS verification code successfully'})