Задача: Разработать и реализовать алгоритмы для нахождения и объединения записей, которые относятся к одному и тому же клиенту из разных информационных систем.
Данные: Синтетические датасеты с информацией о клиентах
- Положить файлы main1.csv, main2.csv, main3.csv в директорию data
- Из корня проекта
docker build -t solution .
- Из корня проекта
docker compose -f docker-compose/docker-compose.yaml up
- Установить виртуальное окружение и зависимости из requirement.txt
- Положить файлы main1.csv, main2.csv, main3.csv в директорию data
- Запустить сервис clickhouse из docker compose
- Поменять в модуле клиента кх
Client(host='clickhouse')
на'localhost'
- Запустить из корня проекта
python3 main.py