Ответ 1
Вы можете сделать это несколькими способами:
-
Чтобы установить количество редукторов для всех операций Pig, вы можете использовать свойство
default_parallel
, но это означает, что каждый отдельный шаг будет использовать один редуктор, уменьшая пропускную способность:set default_parallel 1;
-
До вызова STORE, если одна из выполняемых операций (COGROUP, CROSS, DISTINCT, GROUP, JOIN (внутренняя), JOIN (внешняя) и ORDER BY), вы можете использовать
PARALLEL 1
чтобы обозначить использование одного редуктора для выполнения этой команды:GROUP a BY grp PARALLEL 1;
Подробнее см. Поваренную книгу свиней - Параллельные функции.