Применение одинаковых коэффициентов к нескольким переменным в R-кадре данных

Я работаю с набором данных, который включает 16 вопросов, в которых набор ответов идентичен (Да, Нет, Неизвестно или Отсутствует). Я обрабатываю данные с помощью R, и я хочу превратить каждую из переменных в фактор. Для одной переменной я мог бы использовать следующую конструкцию:

Я бы не хотел набирать это 16 раз. Я мог бы сделать это с помощью for(), но мне было интересно, есть ли более ясный, более R-способ сделать это. Некоторые примеры данных:

Ответы

Ответ 1

df[] <- lapply(df, factor, 
              levels=c(-9, 0, 1), 
              labels = c("Unknown or Missing", "No", "Yes"))
str(df)

Скорее всего, это будет быстрее, чем применять или использовать, которые нуждаются в data.frame для реформирования/переклассификации этих результатов. Хитрость здесь заключается в том, что использование [] в LHS присваивания сохраняет структуру цели (поскольку R "знает", что такое его класс и размеры, а необходимость data.frame в списке из lapply не является Если бы вы хотели сделать это только с выбранными столбцами, вы могли бы сделать это:

 df[colnums] <- lapply(df[colnums], factor, 
              levels=c(-9, 0, 1), 
              labels = c("Unknown or Missing", "No", "Yes"))
 str(df)

Ответ 2

Базовое решение R с использованием apply

 data.frame(apply(df, 2, factor, 
                 levels=c(-9, 0, 1), 
                 labels = c("Unknown or Missing", "No", "Yes")))

Используя sapply

data.frame(sapply(df, factor, levels=c(-9, 0, 1), 
         labels = c("Unknown or Missing", "No", "Yes")))