Ответ 1
Я определенно рекомендую Weka, который является программным обеспечением для разработки данных с открытым исходным кодом, написанным на Java:
Weka - это набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схем машинного обучения.
Как упоминалось выше, он поставляется с множеством разных классификаторов, таких как SVM, Winnow, C4.5, Наивный Байес (конечно) и многие другие (см. API doc). Обратите внимание, что многие классификаторы, как известно, имеют гораздо лучшую производительность, чем Naive Bayes, в области обнаружения спама или классификации текста.
Кроме того, Weka приносит вам мощный мощный графический интерфейс...