Ответ 1
Вам нужно экспортировать эти переменные в другие R-процессы в кластере:
cl <- makeCluster(mc <- getOption("cl.cores", 4))
clusterExport(cl=cl, varlist=c("text.var", "ntv", "gc.rate", "pos"))
Недавно я получил компьютер с несколькими ядрами и изучаю использование параллельных вычислений. Я достаточно разбираюсь в lapply
, и мне сказали, что parLapply
работает очень похоже. Я не работаю правильно. Кажется, я должен явно разместить все внутри parLapply
, чтобы он работал (это функции, которые нужно использовать, переменные и т.д.). С lapply
он читает из родительской среды, а parLapply
, похоже, не делает этого. Поэтому в моем примере ниже я мог бы сделать все, поместив всю информацию внутри parLapply
, но если я использую это внутри определенной пользователем функции, я не могу явно разместить text.var
внутри parLapply
.
library(parallel)
text.var <- rep("I like cake and ice cream so much!", 20)
ntv <- length(text.var)
gc.rate <- 10
pos <- function(i) {
paste(sapply(strsplit(tolower(i), " "), nchar), collapse=" | ")
}
lapply(seq_len(ntv), function(i) {
x <- pos(text.var[i])
if (i%%gc.rate==0) gc()
return(x)
}
)
#doesn't work
cl <- makeCluster(mc <- getOption("cl.cores", 4))
parLapply(cl, seq_len(ntv), function(i) {
x <- pos(text.var[i])
if (i%%gc.rate==0) gc()
return(x)
}
)
#does work but have to specify all the stuff inside parLapply
cl <- makeCluster(mc <- getOption("cl.cores", 4))
parLapply(cl, seq_len(ntv), function(i) {
######stuff I have to put inside parLapply##########
text.var <- rep("I like cake and ice cream so much!", 20)
ntv <- length(text.var)
gc.rate <- 10
pos <- function(i) {
paste(sapply(strsplit(tolower(i), " "), nchar), collapse=" | ")
}
######stuff I have to put inside parLapply##########
x <- pos(text.var[i])
if (i%%gc.rate==0) gc()
return(x)
}
)
Как передать text.var
, ntv
, gc.rate
и pos
в parLapply
без явного помещения их внутрь? (Я предполагаю, что вы как-то передаете их как список)
PS windows 7 machine, поэтому мне нужно использовать parLapply
Я думаю
Вам нужно экспортировать эти переменные в другие R-процессы в кластере:
cl <- makeCluster(mc <- getOption("cl.cores", 4))
clusterExport(cl=cl, varlist=c("text.var", "ntv", "gc.rate", "pos"))
Здесь также будет работать альтернативный метод предоставленный Мартином Морганом.
Этот метод предоставляет объекты каждому node в кластере непосредственно в вызове parLapply
без необходимости использования экспорта кластера:
library(parallel)
text.var <- rep("I like cake and ice cream so much!", 20)
ntv <- length(text.var)
gc.rate <- 10
pos <- function(i) {
paste(sapply(strsplit(tolower(i), " "), nchar), collapse=" | ")
}
cl <- makeCluster(mc <- getOption("cl.cores", 4))
parLapply(cl, seq_len(ntv), function(i, pos, text.var, ntv, gc.rate) {
x <- pos(text.var[i])
if (i%%gc.rate==0) gc()
return(x)
}, pos, text.var, ntv, gc.rate
)
out1<-lapply(seq_len(ntv), function(i) {x <- pos(text.var[i]);if (i%%gc.rate==0) gc();return(x)})
out2<-parLapply(cl, seq_len(ntv), function(i) {x <- pos(text.var[i]);if (i%%gc.rate==0) gc();return(x)})
> identical(out1,out2)
# [1] TRUE
require(rbenchmark)
benchmark(lapply(seq_len(ntv), function(i) {x <- pos(text.var[i]);if (i%%gc.rate==0) gc();return(x)}),parLapply(cl, seq_len(ntv), function(i) {x <- pos(text.var[i]);if (i%%gc.rate==0) gc();return(x)}))
test
#1 lapply(seq_len(ntv), function(i) {\n x <- pos(text.var[i])\n if (i%%gc.rate == 0) \n gc()\n return(x)\n})
#2 parLapply(cl, seq_len(ntv), function(i) {\n x <- pos(text.var[i])\n if (i%%gc.rate == 0) \n gc()\n return(x)\n})
# replications elapsed relative user.self sys.self user.child sys.child
#1 100 20.03 3.453448 20.31 0.05 NA NA
#2 100 5.80 1.000000 0.22 0.03 NA NA
> cl
socket cluster with 2 nodes on host ‘localhost’