Параллельные вычисления с кластерами, отличными от снега SOCK
Недавнее добавление прямой поддержки параллельных вычислений в R2.14 вызвало у меня вопрос. Существует множество вариантов создания кластеров в R. Я регулярно использую кластеры snow
SOCK, но я знаю, что есть другие способы, такие как MPI. Я использую кластеры SOCK snow
, потому что мне не нужно устанавливать какое-либо дополнительное программное обеспечение (я использую Fedora 13).
Итак, мои конкретные вопросы:
- Есть ли выигрыш в производительности при использовании кластеров, отличных от SOCK?
- Легче ли создавать кластеры на нескольких компьютерах с использованием кластеров, отличных от SOCK?
Ответы
Ответ 1
1) существует ограниченное количество доступных тестов, которые доказывают, что MPI будет быстрее, чем SOCKets. Но как пользователь R вы, вероятно, не будете заботиться об этих различиях. Они находятся в области миллисекунд, и количество сообщений не так высоко в неловко параллельных проблемах.
2) Да, вам не обязательно указывать список имен компьютеров или IP-адресов. Для компьютерного кластера с 100 узлами это усложняется. Но все зависит от вашего компьютерного кластера. В большинстве случаев MPI или PVM уже предустановлены, и все работает из коробки с помощью Rmpi,...