Skip to content

Latest commit

 

History

History
19 lines (13 loc) · 1.25 KB

README.MD

File metadata and controls

19 lines (13 loc) · 1.25 KB

КЕЙС 1 Record Linkage для данных о клиентах

Задача: Разработать и реализовать алгоритмы для нахождения и объединения записей, которые относятся к одному и тому же клиенту из разных информационных систем.

Данные: Синтетические датасеты с информацией о клиентах

Для запуска через docker-compose:
  • Положить файлы main1.csv, main2.csv, main3.csv в директорию data
  • Из корня проекта docker build -t solution .
  • Из корня проекта docker compose -f docker-compose/docker-compose.yaml up
Для запуска локально:
  • Установить виртуальное окружение и зависимости из requirement.txt
  • Положить файлы main1.csv, main2.csv, main3.csv в директорию data
  • Запустить сервис clickhouse из docker compose
  • Поменять в модуле клиента кх Client(host='clickhouse') на 'localhost'
  • Запустить из корня проекта python3 main.py