Объединение таблиц с разными именами столбцов

Если я правильно понял, по умолчанию data.table объединяет две таблицы, сравнивая столбцы, которые задаются как ключи и имеют одинаковые имена. Как мне писать, если у меня есть таблицы с разными именами столбцов? Например:

Что мне следует писать в DT1[, чтобы слияние выбирало только строки с col2 == col5 и col3 == col4? Вот ожидаемый результат:

Ответы

Ответ 1

Используя соединения на основе набора данных .table подмножество вместе с недавно реализованным аргументом on= и nomatch=0L, это просто:

DT2[DT1, on=c(col5="col2", col4="col3"), nomatch=0L]

Подробнее см. дополнительные индексы для виньетки.

В качестве альтернативы, если у вас есть key.dables.tables, вы можете пропустить аргумент on=. Но вышеприведенное решение было бы идиоматичным, поскольку оно сохраняет порядок исходных данных .tables, и ясно, какие столбцы просматриваются, просматривая код.

setkey(DT1, col2, col3)
setkey(DT2, col5, col4)
DT2[DT1, nomatch=0L]

См. историю для более старых версий.