Что такое параметр initializationSteps в Kmeans ++ в Spark MLLib?
Я знаю, что такое k-средство, и я также понимаю, что такое алгоритм k-mean ++. Я считаю, что единственное изменение - это то, как найдены исходные K-центры.
В версии ++ мы изначально выбираем центр и используя распределение вероятности, мы выбираем остальные k-1-центры.
В алгоритме MLLib для k-означает, что является параметром initializationSteps
?
Ответы
Ответ 1
Чтобы быть точным, k-mean ++ является алгоритмом выбора начальных центров и не описывает весь процесс обучения.
MLLib k-means использует k-means || для инициализации, которая является распределенным вариантом ++. Он отображает не одну, а несколько точек для количества итераций.
initializationSteps
соответствует числу итераций, и согласно исходная бумага должна быть примерно O (log n).