Data.table WHERE before BY - программирование

У меня есть следующая проблема, которая, вероятно, довольно простое решение: Когда я использую

Проблема заключается в том, что, по-видимому, она сначала сортирует строки, где категория равна 1, а затем использует команду by. Так что я получаю:

Я создаю таблицу данных, содержащую только информацию о пользователях, поэтому:

который выдает ошибки или включает неправильные значения, когда есть некоторые пользователи, у которых нет записи.

Ответы

Ответ 1

Это почти так же лаконично и выполняется.

actions[, .SD[category==1, sum(value)], by=User_id]
#    User_id V1
# 1:    Carl 30
# 2:    Lisa  0
# 3:     Moe 50

## Or, better yet, no need to muck around with .SD, (h.t. David Arenburg)
actions[, sum(value[category == 1]), by = User_id]
#    User_id V1
# 1:    Carl 30
# 2:    Lisa  0
# 3:     Moe 50

Если относительная неэффективность вышеизложенного является проблемой в вашем случае использования, здесь более эффективная альтернатива:

res <- actions[, .(val=0), by=User_id]
res[actions[category==1, .(val=sum(value)), by=User_id], val:=i.val, on="User_id"]    
res
#    User_id val
# 1:    Carl  30
# 2:    Lisa   0
# 3:     Moe  50