Суммируя подсчеты коэффициента с dplyr
Я хочу группировать кадр данных с помощью столбца (владельца) и выводить новый кадр данных, который имеет подсчеты каждого типа фактора при каждом наблюдении. Реальный кадр данных довольно велик, и существует 10 различных факторов.
Вот пример ввода:
library(dplyr)
df = tbl_df(data.frame(owner=c(0,0,1,1), obs1=c("quiet", "loud", "quiet", "loud"), obs2=c("loud", "loud", "quiet", "quiet")))
owner obs1 obs2
1 0 quiet loud
2 0 loud loud
3 1 quiet quiet
4 1 loud quiet
Я искал вывод, который выглядит так:
out = data.frame(owner=c("0", "0", "1", "1"), observation=c("obs1", "obs2", "obs1", "obs2"), quiet=c(1, 0, 1, 2), loud=c(1, 2, 1, 0))
owner observation quiet loud
1 0 obs1 1 1
2 0 obs2 0 2
3 1 obs1 1 1
4 1 obs2 2 0
Таяние меня туда-сюда:
melted = tbl_df(melt(df, id=c("owner")))
owner variable value
1 0 obs1 quiet
2 0 obs1 loud
3 1 obs1 quiet
4 1 obs1 loud
5 0 obs2 loud
6 0 obs2 loud
7 1 obs2 quiet
8 1 obs2 quiet
Но какой последний шаг? Если "value" было числовым, я бы просто пошел:
melted %>% group_by(owner, variable) %>% summarise(counts=sum(value))
Большое спасибо!
Ответы
Ответ 1
Вы можете использовать tidyr
с dplyr
library(dplyr)
library(tidyr)
df %>%
gather(observation, Val, obs1:obs2) %>%
group_by(owner,observation, Val) %>%
summarise(n= n()) %>%
ungroup() %>%
spread(Val, n, fill=0)
который дает выход
# owner observation loud quiet
#1 0 obs1 1 1
#2 0 obs2 2 0
#3 1 obs1 1 1
#4 1 obs2 0 2
Ответ 2
В 2017 году ответ
library(dplyr)
library(tidyr)
gather(df, key, value, -owner) %>%
group_by(owner, key, value) %>%
tally %>%
spread(value, n, fill = 0)
Что дает вывод
Source: local data frame [4 x 4]
Groups: owner, key [4]
owner key loud quiet
* <dbl> <chr> <dbl> <dbl>
1 0 obs1 1 1
2 0 obs2 2 0
3 1 obs1 1 1
4 1 obs2 0 2
Ответ 3
Если вы хотите отказаться от dplyr
, вы можете разбить на списки.
df <- split(df, list(df[[obs1]], df[[obs2]])
Если вам нужен count
, вы просто создаете вызов sapply
или lapply
для запуска списков и получения счета каждого из них. Или буквально любая другая функция, которую вы хотите.