Использование каретки с использованием метода gbm для многоклассовой классификации

Я решаю проблему классификации многоклассов и пытаюсь использовать обобщенные расширенные модели (пакет gbm в R). Проблема, с которой я столкнулся: функция train для каретки train, похоже, не работает с данными мультикласса правильно. Ниже представлен простой пример.

Но если я пытаюсь использовать gbm без оболочки, я получаю хорошие результаты.

FYI, код в строке, помеченной ##!, преобразует матрицу вероятностей класса, возвращаемую predict.gbm, в фактор наиболее вероятных классов. Выходной сигнал

Любые предложения о том, как заставить карет правильно работать с gbm для многоклассовых данных?

Ответы

Ответ 1

Это проблема, над которой я сейчас работаю.

Это поможет, если вы разместите результаты sessionInfo().

Кроме того, вы можете решить проблему с последним gbm https://code.google.com/p/gradientboostedmodels/.

Max

Ответ 2

Обновление: Caret может выполнять классификацию нескольких классов.

Вы должны убедиться, что метка класса находится в альфа-цифровом формате (начиная с буквы).

Например: если у вас есть метки "1", "2", "3", затем измените их на "Seg1", "Seg2" и "Seg3", иначе карет с ошибкой.

Ответ 3

Обновление: исходный код запускается и производит следующий вывод

+ Fold1.Rep1: shrinkage=0.1, interaction.depth=1, n.trees=150 
- Fold1.Rep1: shrinkage=0.1, interaction.depth=1, n.trees=150 
...
...
...
+ Fold5.Rep1: shrinkage=0.1, interaction.depth=3, n.trees=150 
- Fold5.Rep1: shrinkage=0.1, interaction.depth=3, n.trees=150 
Aggregating results
Selecting tuning parameters
Fitting n.trees = 50, interaction.depth = 2, shrinkage = 0.1 on full training set
> gbmFit
Stochastic Gradient Boosting 

150 samples
  4 predictor
  3 classes: 'setosa', 'versicolor', 'virginica' 

No pre-processing
Resampling: Cross-Validated (5 fold, repeated 1 times) 

Summary of sample sizes: 120, 120, 120, 120, 120 

Resampling results across tuning parameters:

  interaction.depth  n.trees  Accuracy   Kappa  Accuracy SD
  1                   50      0.9400000  0.91   0.04346135 
  1                  100      0.9400000  0.91   0.03651484 
  1                  150      0.9333333  0.90   0.03333333 
  2                   50      0.9533333  0.93   0.04472136 
  2                  100      0.9533333  0.93   0.05055250 
  2                  150      0.9466667  0.92   0.04472136 
  3                   50      0.9333333  0.90   0.03333333 
  3                  100      0.9466667  0.92   0.04472136 
  3                  150      0.9400000  0.91   0.03651484 
  Kappa SD  
  0.06519202
  0.05477226
  0.05000000
  0.06708204
  0.07582875
  0.06708204
  0.05000000
  0.06708204
  0.05477226

Tuning parameter 'shrinkage' was held constant at a value of 0.1
Accuracy was used to select the optimal model using  the
 largest value.
The final values used for the model were n.trees =
 50, interaction.depth = 2 and shrinkage = 0.1. 
> summary(gbmFit)
                      var    rel.inf
Petal.Length Petal.Length 74.1266408
Petal.Width   Petal.Width 22.0668983
Sepal.Width   Sepal.Width  3.2209288
Sepal.Length Sepal.Length  0.5855321