Skip to content

Solution for 'record linkage' case at IT Inno Hack: matching of similar records in different data sources. 🏅️ Top-3

Notifications You must be signed in to change notification settings

varsey/inno-hack-24-ml-cious

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

КЕЙС 1 Record Linkage для данных о клиентах

Задача: Разработать и реализовать алгоритмы для нахождения и объединения записей, которые относятся к одному и тому же клиенту из разных информационных систем.

Данные: Синтетические датасеты с информацией о клиентах

Для запуска через docker-compose:
  • Положить файлы main1.csv, main2.csv, main3.csv в директорию data
  • Из корня проекта docker build -t solution .
  • Из корня проекта docker compose -f docker-compose/docker-compose.yaml up
Для запуска локально:
  • Установить виртуальное окружение и зависимости из requirement.txt
  • Положить файлы main1.csv, main2.csv, main3.csv в директорию data
  • Запустить сервис clickhouse из docker compose
  • Поменять в модуле клиента кх Client(host='clickhouse') на 'localhost'
  • Запустить из корня проекта python3 main.py

About

Solution for 'record linkage' case at IT Inno Hack: matching of similar records in different data sources. 🏅️ Top-3

Resources

Stars

Watchers

Forks