Как MPI_Scatter и MPI_Gather используются с C?

Пока мое приложение читает в txt файле со списком целых чисел. Эти целые числа должны храниться в массиве с помощью главного процесса, то есть процессора с рангом 0. Это работает нормально.

Теперь, когда я запускаю программу, у меня есть оператор if, проверяющий, является ли это главным процессом, и если это так, я выполняю команду MPI_Scatter.

Из того, что я понимаю, это разделит массив на числа и передаст его подчиненным процессам, то есть всем с рангами > 0. Однако я не уверен, как обращаться с MPI_Scatter. Как подчиненный процесс "подписаться" для получения подматрицы? Как я могу сказать, что не-мастер-процессы что-то делают с подматрицей?

Может ли кто-нибудь предоставить простой пример, чтобы показать мне, как мастер-процесс отправляет элементы из массива, а затем подчиненные добавляют сумму и возвращают это мастеру, который суммирует все суммы и распечатывает их?

Ответы

Ответ 1

Это распространенное непонимание того, как операции работают в MPI с новыми людьми; особенно с коллективными операциями, когда люди пытаются начать использовать трансляцию (MPI_Bcast) только с ранга 0, ожидая, что вызов каким-то образом "подтолкнет" данные к другим процессорам. Но это не так, как работают MPI-процедуры; для большинства MPI-сообщений требуется, чтобы отправитель и получатель выполняли вызовы MPI.

В частности, MPI_Scatter() и MPI_Gather() (и MPI_Bcast и многие другие) являются коллективными операциями; они должны быть вызваны всеми задачами в коммуникаторе. Все процессоры в коммуникаторе совершают один и тот же вызов, и операция выполняется. (Для того чтобы разброс и сбор данных требовали в качестве одного из параметров "корневого" процесса, откуда все данные поступают/поступают). Таким образом, реализация MPI имеет много возможностей для оптимизации шаблонов связи.

Итак, вот простой пример ( Обновлен, чтобы включить сбор):

#include <mpi.h>
#include <stdio.h>
#include <stdlib.h>

int main(int argc, char **argv) {
    int size, rank;

    MPI_Init(&argc, &argv);
    MPI_Comm_size(MPI_COMM_WORLD, &size);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);

    int *globaldata=NULL;
    int localdata;

    if (rank == 0) {
        globaldata = malloc(size * sizeof(int) );
        for (int i=0; i<size; i++)
            globaldata[i] = 2*i+1;

        printf("Processor %d has data: ", rank);
        for (int i=0; i<size; i++)
            printf("%d ", globaldata[i]);
        printf("\n");
    }

    MPI_Scatter(globaldata, 1, MPI_INT, &localdata, 1, MPI_INT, 0, MPI_COMM_WORLD);

    printf("Processor %d has data %d\n", rank, localdata);
    localdata *= 2;
    printf("Processor %d doubling the data, now has %d\n", rank, localdata);

    MPI_Gather(&localdata, 1, MPI_INT, globaldata, 1, MPI_INT, 0, MPI_COMM_WORLD);

    if (rank == 0) {
        printf("Processor %d has data: ", rank);
        for (int i=0; i<size; i++)
            printf("%d ", globaldata[i]);
        printf("\n");
    }

    if (rank == 0)
        free(globaldata);

    MPI_Finalize();
    return 0;
}

Запуск он дает:

gpc-f103n084-$ mpicc -o scatter-gather scatter-gather.c -std=c99
gpc-f103n084-$ mpirun -np 4 ./scatter-gather
Processor 0 has data: 1 3 5 7 
Processor 0 has data 1
Processor 0 doubling the data, now has 2
Processor 3 has data 7
Processor 3 doubling the data, now has 14
Processor 2 has data 5
Processor 2 doubling the data, now has 10
Processor 1 has data 3
Processor 1 doubling the data, now has 6
Processor 0 has data: 2 6 10 14