В чем разница между рабочим процессом Oozie, координатором и узлом
В чем разница между рабочим процессом Oozie, координатором и связкой?
Рабочий процесс Oozie определяет последовательность действий. И мы должны вызывать его вручную каждый раз, когда мы хотим, чтобы он запускался. Там, где один и тот же рабочий процесс может быть запланирован через координатора. Правильно ли это понимание?
Тогда что дополнительно в комплекте?
Думаю, он снова используется для планирования набора координаторов. Тогда почему нельзя назначить одного координатора для планирования другого координатора, как один рабочий процесс, может иметь другой под-рабочий процесс.
Ответы
Ответ 1
Процедура:
Это последовательность действий. Он написан в xml, и действия могут быть уменьшены с карты, улей, свиней и т.д.
Координатор:
Это программа, которая запускает действия (обычно рабочие задания), когда выполняется множество условий. Условиями могут быть временная частота, другие внешние события и т.д.
Bundle:
Он определяется как абстракция oozie более высокого уровня, которая включает в себя набор заданий координатора. Мы можем указать время начала задания пакета.
Ответ 2
Рабочий процесс не имеет временных спецификаций для запуска любого задания hadoop. Работа координатора имеет временные спецификации о работе в координаторе.xml с использованием частотного тега. Работы коллективного координатора считаются заданием Bundle. В задании Bundle отдельные пользователи могут назначать свои собственные задания, используя их job.properties, для своих соответствующих заданий.
Ответ 3
Для моего понимания, используя bundle, можно сгруппировать пару координаторов, поэтому менеджеру лучше будет просматривать, запускать/останавливать...
Вероятно, у нас есть два конвейера данных: один для ведения журнала (сбор/анализ /ETL), один для бизнес-логики.
Затем я создаю два пакета для групп разных типов координаторов.