Работу выполнили:
- Василов Тимур, 11-909
- Ромаданский Кирилл, 11-909
- Бондарь Алексей, 11-911
Тема работы: "Ассоциативные правила для поиска аномалий".
Датасет: Market_Basket_Optimisation.csv содержит данные о произведенных в магазине транзакциях. Всего в датасете представлено 7502 строк - транзакций, состощих из списка товаров.
Цель: Выявить ассоциативные правила и применить их для поиска аномалий.
Полное описание проекта с объяснением всех шагов находится в блокноте Association_rules.ipynb.
- Представляем датасет в виде денормализованной "плотной" таблицы Pandas DataFrame с помощью One-Hot кодирования.
- Анализируем датасет, чтобы определить распределние частот появления всех товаров в транзакциях.
- Подключаем библиотеку mlxtend для расчета ассоциативных правил.
- Используя алгоритм Apriori, строим ассоциативные правила, анализируем полученный результат.
- Обнаруживаем антипатерны с помощью метрики conviction.
- Используя алгоритм FP-Growth, строим ассоциативные правила, анализируем полученный результат.
- Устанавливаем библиотеку pyECLAT и, используя алгоритм ECLAT, строим ассоциативные правила, анализируем полученный результат.
- Сравниваем полученные результаты.