В репозитории представлены проекты курса Аналитик данных (Яндекс.Практикум).
- Языки: Python, SQL
- Анализ данных: библиотеки Pandas, NumPy, SciPy, Statsmodels
- Визуализация: Matplotlib, Plotly, Seaborn
- Построение дашбордов: Tableau
- Метрики юнит-экономики, когортный анализ
- А/В-тестирование
- Работа с гипотезами
- Машинное обучение: библиотеки Scikit-learn, XGBoost
№ | Название и ссылка | О чем проект | Навыки и инструменты |
---|---|---|---|
1 | Вводный проект. Музыка больших городов | Сравниваем данные пользователей Яндекс.Музыки по городам и дням недели | Python Pandas |
2 | Исследование надежности заемщиков | Разбираемся, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Анализируем данные о клиентах банка и определяем долю кредитоспособных | предобработка данных Python Pandas |
3 | Исследование объявлений о продаже квартир | Исследуем архив объявлений о продаже объектов недвижимости в Санкт-Петербурге и Ленинградской области (основные свойства данных, поиск закономерностей, распределений и аномалий) | Python Pandas Matplotlib предобработка данных исследовательский анализ данных визуализация данных |
4 | Определение перспективного тарифа для телеком-компании | Делаем предварительный анализ тарифов на небольшой выборке клиентов. Анализируем поведение клиентов и делаем вывод, какой тариф лучше | Python Pandas Matplotlib NumPy SciPy проверка статистических гипотез описательная статистика |
5 | Сборный проект 1. Анализ рынка продаж компьютерных игр | Ищем закономерности в данных о продаже игры и выявляем те, которые определяют их успешность. Это позволият сделать ставку на потенциально популярный продукт и спланировать рекламные кампании | Python Pandas NumPy Matplotlib предобработка данных исследовательский анализ данных описательная статистика проверка статистических гипотез |
6 | Базовый SQL | Пишем ряд запросов разной сложности к базе данных, в которой хранятся данные по венчурным инвесторам, стартапам и инвестициям в них | SQL PostgreSQL |
7 | Анализ бизнес-показателей развлекательного приложения | На основе данных изучаем поведение пользователей, а также анализируем доходность клиентов и окупаемость рекламы, чтобы предложить рекомендации для отдела маркетинга | Python Pandas Matplotlib когортный анализ юнит-экономика продуктовые метрики Seaborn |
8 | Продвинутый SQL | С помощью Python и SQL подключаемся к базе данных, считаем и визуализируем ключевые метрики сервис-системы вопросов и ответов о программировании | SQL PostgreSQL |
9 | Принятие решений в бизнесе | Анализируем результаты A/B-тестирования в крупном интернет-магазине, приоритизируем гипотезы | Python Pandas Matplotlib SciPy A/B-тестирование проверка статистических гипотез |
10 | Сборный проект 2. Анализ поведения пользователей мобильного приложения | Исследуем воронку продаж и анализируем результаты A/A/B-тестирования в мобильном приложении | Python Pandas Matplotlib SciPy A/B-тестирование проверка статистических гипотез Seaborn событийная аналитика продуктовые метрики Plotly визуализация данных |
11 | Исследование рынка общественного питания | Исследование рынка на основе открытых данных о заведениях общественного питания Москвы | Python Pandas Matplotlib Seaborn Plotly визуализация данных |
12 | Дашборд для Яндекс.Дзена и Презентация | Разрабатываем и презентуем дашборд для анализа пользовательского взаимодействия в сервисе Яндекс.Дзен (Tableau Public) | Python PostgreSQL Tableau продуктовые метрики построение дашбордов |
13 | Прогнозирование оттока клиентов сети фитнес-центров | Разрабатываем модель машинного обучения для прогнозирования оттока клиентов в фитнес-центре. Наша задача — провести анализ, составить портреты клиентов и подготовить план действий по их удержанию | Python Pandas Scikit-learn Matplotlib Seaborn машинное обучение классификация кластеризация |
14 | Выпускной проект. Банки — cегментация пользователей по потреблению продуктов, Презентация и Дашборд; А/B тестирование, SQL | Анализируем заемщиков банка (результат оформляем в виде Презентации), проверяем результаты А/B тестирования и подтверждаем гипотезы, разрабатываем дашборд в Tableau Public. изучаем мобильное приложение посредством SQL-запросов. | SQL PostgreSQL Python Pandas Scikit-learn Matplotlib Seaborn машинное обучение классификация кластеризация Tableau продуктовые метрики построение дашбордов A/B-тестирование проверка статистических гипотез |