Dplyr:: group_by_ с символьной строкой ввода нескольких имен переменных

Я пишу функцию, в которой пользователю предлагается определить одну или несколько переменных группировки в вызове функции. Затем данные группируются с использованием dplyr и работают, как ожидалось, если есть только одна переменная группировки, но я не понял, как это сделать с несколькими переменными группировки.

Я попытался превратить y в то же самое, что и dots, используя:

Как использовать пользовательскую строку ввода из > 1 имен переменных (например, y в примере) для группировки данных с помощью dplyr?

(Этот вопрос каким-то образом связан с этим, но не ответил там.)

Ответы

Ответ 1

Нет необходимости в interp здесь, просто используйте as.formula для преобразования строк в формулы:

dots = sapply(y, . %>% {as.formula(paste0('~', .))})
mtcars %>% group_by_(.dots = dots)

Причина, по которой ваш подход interp не работает, заключается в том, что выражение возвращает вам следующее:

~list(c("cyl", "gear"))

- не то, что вы хотите. Вы могли бы, конечно, sapply interp над y, что было бы похоже на использование as.formula выше:

dots1 = sapply(y, . %>% {interp(~var, var = .)})

Но на самом деле вы также можете напрямую передать y:

mtcars %>% group_by_(.dots = y)

dplyr vignette на нестандартной оценке более подробно объясняет и объясняет разницу между этими подходами.