Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Специалист по Data Science plus".
Хранение результатов проектов, выполненных в ходе обучения.
Название проекта | Описание | Закрепляемая тема | Используемые библиотеки |
---|---|---|---|
Музыка больших городов | Сравнение предпочтений пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | Базовый Python | pandas only |
Банковский скоринг | Проверить, действительно ли такие показатели как "количество детей" и "семейное положение" коррелируют с вероятностью невозврата кредита | Предобработка данных | pandas, numpy, seaborn, pymystem3 |
Продажи квартир в Санкт-Петербурге | Выявить параметры, позволяющие построить автоматизированную систему для отслеживания аномалий и мошеннической деятельности | Исследовательский анализ данных | pandas, numpy, seaborn, sklearn |
Российский кинопрокат | Изучить рынок российского кинопроката и выявить текущие тренды в фильмах с госучастием | Проект по итогам модуля | pandas, numpy, seaborn, sklearn |
Тарифы телеком-оператора | Исследовать поведения абонентов двух тарифов и основных показателей тарифов на основании имеющейся выборки | Статистический анализ данных | pandas, numpy, seaborn, scipy |
Тарифные рекомендации | Построить систему, способную проанализировать поведение клиентов и предложить пользователям новый тариф | Введение в машинное обучение | pandas, sklearn |
Отток клиентов | По историческим данным о поведении клиентов и расторжении договоров с банком спрогнозировать, уйдёт клиент из банка в ближайшее время или нет | Обучение с учителем | numpy, pandas, sklearn, imblearn |
Прогнозирование бурения нефти | Нужно решить, где бурить новую скважину на основе данных геологоразведки региона | Машинное обучение в бизнесе | numpy, pandas, sklearn, seaborn, scipy |
Предсказание отмены брони в отелях | Оценить влияние на бизнес-показатели опции бронирования номера без предоплаты | Проект по итогам модуля | numpy, pandas, sklearn, seaborn, imblearn |
Предсказание цен недвижимости | На основе данных нужно предсказать медианную стоимость дома в жилом массиве | Системы обработки больших данных | pandas, pyspark |
Защита персональных данных | Обфусцировать персональные данные таким образом, чтобы это не сказалось на предсказаниял линейной регрессии. | Линейная алгебра | numpy, pandas, sklearn |
Предсказания цен авто | Построить модель предсказания цен на основе имеющихся описаний проданных автомобилей | Численные методы | numpy, pandas, sklearn, seaborn, lightgbm, category_encoders |
Продвинутый SQL | Выполнить ряд упражнений на составление SQL-запросов к базе данных PostgreSQL из среды jupyter | Продвинутый SQL | pandas, seaborn, sqlalchemy |
Температуры звёзд | С помощью нейросети определять температуру поверхности звёзд. | Модели и алгоритмы в машинном обучении | numpy, pandas, seaborn, torch |
Риск ДТП | Для каршеринговой компании нужно создать систему, которая могла бы оценить риск ДТП по выбранному маршруту движения. | Проект по итогам модуля | numpy, pandas, seaborn, torch, sqlalchemy, tqdm |
Прогноз заказов такси | Построить модель, прогнозирующую количество заказов такси на ближайший час по историческому временному ряду | Временные ряды | numpy, pandas, seaborn, statsmodels |
Сентимент-анализ комментариев | Построить инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. Обучить модель классифицировать комментарии на позитивные и негативные | NLP | pandas, nltk, sklearn |
Определение возраста по фото | Необходимо обучить модель, которая по изображению человека определяет его возраст | Компьютерное зрение | pandas, seaborn, tensorflow, PIL |
Поиск по изображениям | Постройте модель, которая епринимает на вход описание в свободной форме и возвращает список изображений из библиотеки, наиболее соответствующих описанию. | Проект по итогам модуля | pandas, nltk, tensorflow, sklearn, PIL |
Оптимизация процемсса выплавки стали | построить модель, которая будет предсказывать температуру стали. | Выпускной проект | pandas, numpy, seaborn, tensorflow, sklearn, catboost, lightgbm, sqlalchemy |