Используя dplyr и lazyeval с '...'
Упрощение редактирования:
Это сводится к следующему:
df = data.frame(a = 1:10)
#example function that takes optional arguments
mymean <- function(x, w = 1, s = 0) { s + mean(w * x) }
summarize_(df, m = "mean(a)")
#> m
#> 1 5.5
summarize_(df, m = "mymean(a)")
#> Error: could not find function "mymean"
В соответствии с `vignette ( "nse" ) summaryize должен быть задан синтаксис формулы при использовании нестандартных функций суммирования.
В конечном счете, я хочу, чтобы иметь возможность summarize_
обертывать такую функцию:
my_summary <- function(df, x, ...) {
summarize_(df,
m = "mean(a)",
wm = "mymean(a, ...)" #gives error
}
#Partial working function
my_summary <- function(df, x, ...) {
summarize_(df,
m = "mean(a)", #works
wm1 = interp(mymean(a), a = as.name(x) #works but doesn't allow ...
wm2 = interp(mymean(a, b),
.values=list(a = as.name(x),
b = quote(...)), #doesn't work
wm3 = interp(mymean(a, ...), a = as.name(x) #doesn't work
}
Рабочая функция позволила бы мне позвонить:
my_summary(df, a)
#> 5.5
my_summary(df, a, w=5, s=2)
#> 29.5
Ответы
Ответ 1
Поскольку проблема передается функции ...
, одно решение состоит в том, чтобы построить вызов через call
и do.call
(да, оба):
library(dplyr)
df = data.frame(a = 1:10)
mymean = function(x, w = 1, s = 0)
s + mean(w * x)
my_summary = function (df, x, ...) {
x = as.name(substitute(x))
mycall = do.call(call, c('mymean', quote(x), list(...)))
summarize_(df,
m = lazyeval::interp(~mean(x), x = x),
w = lazyeval::lazy_(mycall, environment()))
}
my_summary(df, a)
#> m w
#> 1 5.5 5.5
my_summary(df, a, w = 5, s = 2)
#> m w
#> 1 5.5 29.5
Кстати, вышеупомянутое также исправляет передачу имени столбца - я не мог заставить ваш код работать, и я не думаю, что это сработает.
Ответ 2
Эта очень хакерская, ужасная функция выполняет трюк, но что, если mymean
содержит много необязательных аргументов?
mymean <- function(x, w=1, s = 0) { s + mean(w * x) }
my_summarize <- function(df, x, ...) {
vlist = list(...)
vlist_names = names(vlist)
if ("w" %in% vlist_names & "s" %in% vlist_names) {
res = summarize_(df, m = interp(~mymean(a, w=b, s=c),
.values = list(a = as.name(x),
b = vlist$w,
c = vlist$s)))
}
else if ("w" %in% vlist_names) {
res = summarize_(df, m = interp(~mymean(a, w=b),
.values = list(a = as.name(x),
b = vlist$w)))
}
else if ("s" %in% vlist_names) {
res = summarize_(df, m = interp(~mymean(a, s=c),
.values = list(a = as.name(x),
c = vlist$s)))
}
else {
res = summarize_(df, m = interp(~mymean(a), a = as.name(x)))
}
res
}
df = data.frame(a = 1:10)
my_summarize(df, "a")
#> m
#> 1 5.5
my_summarize(df, "a", s=5)
#> m
#> 1 10.5
my_summarize(df, "a", w=2)
#> m
#> 1 11
my_summarize(df, "a", w=2, s=5)
#> m
#> 1 16