Ответ 1
Некоторые теоретические факты об ассоциативных правилах:
- Правила ассоциации - это тип неориентированного интеллектуального анализа данных, который находит шаблоны в данных, где цель не указана заранее. Независимо от того, имеют ли образцы смысл, человеческая интерпретация.
- Целью правил ассоциации является обнаружение отношений или ассоциаций между конкретными значениями категориальных переменных в больших наборах.
- И правила могут быть поняты как "70% клиентов, которые покупают вино и сыр, также покупают виноград".
Чтобы найти правила ассоциации, вы можете использовать алгоритм априори. Уже существует много реализаций python, хотя большинство из них неэффективны для практического использования:
- source1: http://code.google.com/p/autoflash/source/browse/trunk/python/apriori.py?r=31
- source2: http://www.nullege.com/codes/show/src%40l%40i%40libbyr-HEAD%40test_freq_item_algos.py/5/apriori/python
или используйте библиотеку данных Orange, у которой хорошая библиотека для правил ассоциации.
Пример использования:
'''
save first example as item.basket with format
A, B, C, E
A, C
A, C, D, E
A, C, E
open ipython same directory as saved file or use os module
>>> import os
>>> os.chdir("c:/orange")
'''
import orange
items = orange.ExampleTable("item")
#play with support argument to filter out rules
rules = orange.AssociationRulesSparseInducer(items, support = 0.1)
for r in rules:
print "%5.3f %5.3f %s" % (r.support, r.confidence, r)
Чтобы узнать больше об ассоциативных правилах/частых деталях, тогда мой выбор книг:
- "Введение в интеллектуальный анализ данных" - Випин Кумар, лучшая книга для начинающих.
- "Руководство по сбору данных и знаниям" , для продвинутого пользователя
- "Массивные массивные данные" - подсказывает, как использовать в reallife и как создавать эффективные решения, бесплатную книгу, http://i.stanford.edu/~ullman/mmds.html
- Конечно, есть много фантастических научных статей для чтения: на примере выполните некоторые поиски в MS Acedemic о разработке частых шаблонов
Нет короткого пути.