Внедрение программных продуктов с открытым исходным кодом
Я оцениваю пакеты данных.
Я нашел эти два до сих пор:
RapidMiner
Weka
Есть ли у вас опыт поделиться этими двумя продуктами или любым другим продуктом, чтобы рекомендовать меня?
Спасибо
Ответы
Ответ 1
Согласно ежегодным опросам KDnuggets 2007, 2008 и 2009, RapidMiner является наиболее широко используемым решением для поиска данных с открытым исходным кодом среди экспертов по интеллектуальному анализу данных по всему миру:
Опрос Google Data Mining Tool 2009
RapidMiner - это open source и 100% Java, RapidMiner гораздо более гибкий и предлагает значительно больше функциональности, чем Weka и KNIME.
В отношении реализации SVM: Weka имеет одну такую реализацию (LibSVM), в то время как RapidMiner предоставляет четыре реализации SVM (LibSVM, MySVM, EvoSVM, SMO-SVM), некоторые из которых имеют более сложные функции.
Ответ 2
Другой альтернативой будет Orange. Он включает в себя различные алгоритмы и методы интеллектуального анализа данных, которые вы можете получить либо напрямую через скрипты Python, либо через графический интерфейс.
Ответ 3
Pentaho - хороший костюм для бизнес-аналитики. Так что, возможно, вы хотели бы взглянуть на него. У меня есть некоторый опыт в этом, главным образом для хранилищ данных, и был очень доволен.
Ответ 4
Восстановите колесо и код непосредственно в R!
Ответ 5
Если вас интересует некоторый код Java, связанный с распространением шаблонов шаблонов, правилами ассоциации и последовательным распаковкой шаблонов, у меня есть небольшие проекты с открытым исходным кодом, которые имеют 42 алгоритма связанные с этими темами: http://www.philippe-fournier-viger.com/spmf/
Однако, обратите внимание, что он не предоставляет никакого пользовательского интерфейса. Но он предоставляет некоторые очень специализированные алгоритмы, которые вы не найдете в других пакетах интеллектуального анализа данных.
Ответ 6
Я использовал Weka в старшей школе, и у него была хорошая SVM. Это было 4 или 5 лет назад.
Ответ 7
(KNIME) - довольно обширная платформа для интеллектуального анализа данных.
Ответ 8
Согласно опросу KDnuggets Poll 2011, RapidMiner снова является наиболее широко используемым решением для интеллектуального анализа данных во всем мире:
http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html
Ответ 9
Посмотрите ELKI, что похоже на WEKA, за исключением того, что оно намного сильнее при обнаружении кластеризации и outlier, тогда как WEKA по существу только хорошо классифицирует.
Ответ 10
Как уже говорилось, Pentaho - это мощный пакет Business Intelligence, к которому принадлежит WEKA.
Поэтому я также рекомендовал Weka, только ради того, чтобы у вас было отличное решение для расширения вашего приложения и отличного сообщества.