У меня есть намного больше, чем 3 элемента в каждом классе, но я получаю эту ошибку: класс не может быть меньше k = 3 в scikit-learn
Это моя цель (y):
target = [7,1,2,2,3,5,4,
1,3,1,4,4,6,6,
7,5,7,8,8,8,5,
3,3,6,2,7,7,1,
10,3,7,10,4,10,
2,2,2,7]
Я не знаю, почему, пока я выполняю: ... # Разбить набор данных в двух равных частях X_train, X_test, y_train, y_test = train_test_split ( X, y, test_size = 0.5, random_state = 0)
# Set the parameters by cross-validation
tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4],
'C': [1, 10, 100, 1000]},
{'kernel': ['linear'], 'C': [1, 10, 100, 1000]}]
scores = ['precision', 'recall']
for score in scores:
print("# Tuning hyper-parameters for %s" % score)
print()
clf = GridSearchCV(SVC(C=1), tuned_parameters)#scoring non esiste
#I get error in the line below
clf.fit(X_train, y_train, cv=5)
...
Я получаю эту ошибку:
Traceback (most recent call last):
File "C:\Python27\SVMpredictCROSSeGRID.py", line 232, in <module>
clf.fit(X_train, y_train, cv=5) #The minimum number of labels for any class cannot be less than k=3.
File "C:\Python27\lib\site-packages\sklearn\grid_search.py", line 354, in fit
return self._fit(X, y)
File "C:\Python27\lib\site-packages\sklearn\grid_search.py", line 372, in _fit
cv = check_cv(cv, X, y, classifier=is_classifier(estimator))
File "C:\Python27\lib\site-packages\sklearn\cross_validation.py", line 1148, in check_cv
cv = StratifiedKFold(y, cv, indices=is_sparse)
File "C:\Python27\lib\site-packages\sklearn\cross_validation.py", line 358, in __init__
" be less than k=%d." % (min_labels, k))
ValueError: The least populated class in y has only 1 members, which is too few. The minimum number of labels for any class cannot be less than k=3.
Ответы
Ответ 1
Алгоритм требует, чтобы в вашем учебном наборе было как минимум 3 экземпляра метки. Хотя ваш массив target
содержит не менее 3 экземпляров каждой метки, но когда вы разделяете данные между обучением и тестированием, не все обучающие метки имеют 3 экземпляра.
Вам необходимо объединить некоторые ярлыки классов или увеличить свои образцы обучения, чтобы решить проблему.
Ответ 2
если не удалось разбить тест и набор поездок с каждым классом, заполненным достаточно в каждой сгибе, а затем попробуйте обновить библиотеку scikit.
pip install -U scikit-learn
вы получите то же сообщение, что и предупреждение, чтобы вы могли запустить код.