Ответ 1
Обрезка - это способ уменьшения размера дерева решений. Это уменьшит точность данных обучения, но (в общем) повысит точность невидимых данных. Он используется для смягчения overfitting, где вы достигнете совершенной точности данных обучения, но модель (т.е. дерево решений), которую вы изучаете, настолько конкретным, что это не относится ни к чему, кроме данных обучения.
В целом, если вы увеличите обрезку, точность в наборе тренировок будет ниже. Однако WEKA предлагает различные вещи, чтобы лучше оценить точность, а именно тренировку/тестирование или перекрестное подтверждение. Например, если вы используете кросс-валидацию, вы обнаружите "сладкое пятно" фактора уверенности в обрезке где-нибудь там, где оно достаточно ровно, чтобы сделать научное дерево решений достаточно точным на тестовых данных, но не жертвует слишком большой точностью на данные обучения. Там, где это сладкое пятно лежит, будет зависеть от вашей фактической проблемы, и единственный способ определить ее надежно - попробовать.