Ответ 1
Вы использовали минимальное дерево с перекрестной проверкой ошибок. Альтернативой является использование наименьшего дерева, которое находится в пределах 1 стандартной ошибки лучшего дерева (тот, который вы выбираете). Причиной этого является то, что, учитывая оценки ошибки CV, наименьшее дерево в пределах одной стандартной ошибки делает такую же хорошую работу при прогнозировании наилучшим (наименьшее число ошибок CV), но она делает это с меньшим количеством "терминов" ".
Выделите размер стоимости и размера дерева для un -рубленного дерева с помощью:
plotcp(tree)
Найдите дерево слева от него с минимальной ошибкой, чье значение находится внутри строки ошибок с минимальной ошибкой.
Может быть много причин, почему обрезка не влияет на подогнанное дерево. Например, лучшим деревом может быть тот, где алгоритм остановлен в соответствии с правилами остановки, указанными в ?rpart.control
.