Ответ 1
Вы нашли ошибку:)
Исправлено в https://github.com/celery/celery/commit/b2b9d922fdaed5571cf685249bdc46f28acacde3 будет частью 3.0.4.
У меня есть цепь сельдерея, которая выполняет некоторые задачи. Каждая из задач может быть неудачной и повторной. Ниже приведен быстрый пример:
from celery import task
@task(ignore_result=True)
def add(x, y, fail=True):
try:
if fail:
raise Exception('Ugly exception.')
print '%d + %d = %d' % (x, y, x+y)
except Exception as e:
raise add.retry(args=(x, y, False), exc=e, countdown=10)
@task(ignore_result=True)
def mul(x, y):
print '%d * %d = %d' % (x, y, x*y)
и цепочка:
from celery.canvas import chain
chain(add.si(1, 2), mul.si(3, 4)).apply_async()
Запуск двух задач (и если предположить, что ничего не получается), вы получите/увидите напечатанную:
1 + 2 = 3
3 * 4 = 12
Однако, когда задача добавления не выполняется в первый раз и преуспевает в последующих повторных вызовах, остальные задачи в цепочке не запускаются, то есть задача добавления не выполняется, все остальные задачи в цепочке не запускаются и после несколько секунд задача добавления снова запускается и выполняется успешно, а остальные задачи в цепочке (в этом случае mul.si(3, 4)) не запускаются.
Имеет ли сельдерей способ продолжить неудачные цепочки из задачи, которая не удалась, вперед? Если нет, то какой лучший подход к достижению этого и обеспечить выполнение цепочечных задач в указанном порядке и только после успешного выполнения предыдущей задачи, даже если задача несколько раз повторится?
Примечание 1: Проблема может быть решена путем выполнения
add.delay(1, 2).get()
mul.delay(3, 4).get()
но мне интересно понять, почему цепочки не работают с неудачными задачами.
Вы нашли ошибку:)
Исправлено в https://github.com/celery/celery/commit/b2b9d922fdaed5571cf685249bdc46f28acacde3 будет частью 3.0.4.
Мне также интересно понять, почему цепочки не работают с неудачными задачами.
Я копаю код сельдерея, и то, что я нашел до сих пор:
Реализация происходит на app.builtins.py
@shared_task
def add_chain_task(app):
from celery.canvas import chord, group, maybe_subtask
_app = app
class Chain(app.Task):
app = _app
name = 'celery.chain'
accept_magic_kwargs = False
def prepare_steps(self, args, tasks):
steps = deque(tasks)
next_step = prev_task = prev_res = None
tasks, results = [], []
i = 0
while steps:
# First task get partial args from chain.
task = maybe_subtask(steps.popleft())
task = task.clone() if i else task.clone(args)
i += 1
tid = task.options.get('task_id')
if tid is None:
tid = task.options['task_id'] = uuid()
res = task.type.AsyncResult(tid)
# automatically upgrade group(..) | s to chord(group, s)
if isinstance(task, group):
try:
next_step = steps.popleft()
except IndexError:
next_step = None
if next_step is not None:
task = chord(task, body=next_step, task_id=tid)
if prev_task:
# link previous task to this task.
prev_task.link(task)
# set the results parent attribute.
res.parent = prev_res
results.append(res)
tasks.append(task)
prev_task, prev_res = task, res
return tasks, results
def apply_async(self, args=(), kwargs={}, group_id=None, chord=None,
task_id=None, **options):
if self.app.conf.CELERY_ALWAYS_EAGER:
return self.apply(args, kwargs, **options)
options.pop('publisher', None)
tasks, results = self.prepare_steps(args, kwargs['tasks'])
result = results[-1]
if group_id:
tasks[-1].set(group_id=group_id)
if chord:
tasks[-1].set(chord=chord)
if task_id:
tasks[-1].set(task_id=task_id)
result = tasks[-1].type.AsyncResult(task_id)
tasks[0].apply_async()
return result
def apply(self, args=(), kwargs={}, **options):
tasks = [maybe_subtask(task).clone() for task in kwargs['tasks']]
res = prev = None
for task in tasks:
res = task.apply((prev.get(), ) if prev else ())
res.parent, prev = prev, res
return res
return Chain
Вы можете видеть, что в конце prepare_steps
prev_task
связано со следующей задачей.
Когда prev_task не удалось выполнить следующую задачу, не вызывается.
Я тестирую с добавлением ссылки link_error из предыдущей задачи:
if prev_task:
# link and link_error previous task to this task.
prev_task.link(task)
prev_task.link_error(task)
# set the results parent attribute.
res.parent = prev_res
Но тогда следующая задача должна позаботиться обо всех случаях (возможно, кроме случаев, когда она настроена на неизменность, например, не принимать больше аргументов).
Я думаю, что цепочка может поддерживать это, позволяя некоторым синтаксисам нравится это:
c = chain(t1, (t2, t1e), (t3, t2e))
что означает:
t1
link
до t2
и link_error
до t1e
t2
link
до t3
и link_error
до t2e