CARET. Связь между разделением данных и trainControl

Я внимательно прочитал документацию CARET: http://caret.r-forge.r-project.org/training.html, виньетки, и все совершенно ясно (примеры на сайте очень помогают!), но я все еще путаюсь в отношении отношения между двумя аргументами к trainControl:

и взаимодействие между trainControl и функциями разделения данных в карете (например, createDataPartition, createResample, createFolds и createMultiFolds)

Чтобы лучше сформулировать мои вопросы, позвольте мне использовать следующий пример из документации:

3) Как я могу сделать стратифицированный k-кратный (например, 10-кратный) перекрестный контроль с помощью каретки? Будет ли это делать?

Ответы

Ответ 1

Если вы не знаете, какой метод роли играет, если вы используете индекс, почему бы не применять все методы и сравнивать результаты. Это слепой метод comparaison, но он может дать вам некоторые интуиции.

  methods <- c('boot', 'boot632', 'cv', 
               'repeatedcv', 'LOOCV', 'LGOCV')

Я создаю свой индекс:

  n <- 100
  tmp <- createDataPartition(logBBB,p = .8, times = n)

Я применяю trainControl для моего списка методов, и я удаляю индекс из результата, поскольку он является общим для всех моих методов.

ll <- lapply(methods,function(x)
         trControl = trainControl(method = x, index = tmp))
ll <- sapply(ll,'[<-','index', NULL)

Следовательно, my ll:

                 [,1]      [,2]      [,3]      [,4]         [,5]      [,6]     
method            "boot"    "boot632" "cv"      "repeatedcv" "LOOCV"   "LGOCV"  
number            25        25        10        10           25        25       
repeats           25        25        1         1            25        25       
verboseIter       FALSE     FALSE     FALSE     FALSE        FALSE     FALSE    
returnData        TRUE      TRUE      TRUE      TRUE         TRUE      TRUE     
returnResamp      "final"   "final"   "final"   "final"      "final"   "final"  
savePredictions   FALSE     FALSE     FALSE     FALSE        FALSE     FALSE    
p                 0.75      0.75      0.75      0.75         0.75      0.75     
classProbs        FALSE     FALSE     FALSE     FALSE        FALSE     FALSE    
summaryFunction   ?         ?         ?         ?            ?         ?        
selectionFunction "best"    "best"    "best"    "best"       "best"    "best"   
preProcOptions    List,3    List,3    List,3    List,3       List,3    List,3   
custom            NULL      NULL      NULL      NULL         NULL      NULL     
timingSamps       0         0         0         0            0         0        
predictionBounds  Logical,2 Logical,2 Logical,2 Logical,2    Logical,2 Logical,2