芹菜:如何限制队列中的任务数量并在满时停止进食?
我是Celery的新手,这是我的问题:
假设我有一个脚本,该脚本经常应该从数据库中获取新数据并将其发送给使用Celery的工作人员。
task.py
# Celery Task
from celery import Celery
app = Celery('tasks', broker='amqp://guest@localhost//')
@app.task
def process_data(x):
# Do something with x
pass
fetch_db.py
# Fetch new data from DB and dispatch to workers.
from tasks import process_data
while True:
# Run DB query here to fetch new data from DB fetched_data
process_data.delay(fetched_data)
sleep(30);
我担心的是:每30秒获取一次数据。process_data()函数可能需要更长的时间,并且根据工作人员的数量(尤其是如果数量太少),据我所知,队列可能会受到限制。
- 我不能增加工人的数量。
- 我可以修改代码,以免在队列满时提供队列。
问题是如何设置队列大小以及如何知道队列已满?一般来说,如何处理这种情况?
-
您可以设置的RabbitMQ
x-max-length
使用队列预先声明海带例如:
import time from celery import Celery from kombu import Queue, Exchange class Config(object): BROKER_URL = "amqp://guest@localhost//" CELERY_QUEUES = ( Queue( 'important', exchange=Exchange('important'), routing_key="important", queue_arguments={'x-max-length': 10} ), ) app = Celery('tasks') app.config_from_object(Config) @app.task(queue='important') def process_data(x): pass
或使用政策
rabbitmqctl set_policy Ten "^one-meg$" '{"max-length-bytes":1000000}' --apply-to queues