Skip to content

bvgtomsk/DSPR-EDA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

DSPR-EDA.-project2

Оглавление

1. Описание проекта
2. Какой кейс решаем?
3. Краткая информация о данных
4. Этапы работы над проектом
5. Результат
6. Выводы

Описание проекта

Разведовательный анализ базы данных об учениках средней школы

⬆️к оглавлению

Какой кейс решаем?

необходимо произвести разведовательный анализ данных, а также произвести первичную очистку данных от выбросов и пропущенных значений.

Краткая информация о данных

Вход:

  1. фрагмент базы данных с информации о жизненных условиях и среднему балу по математике учеников средней школы

⬆️к оглавлению

Этапы работы над проектом

  1. Изучить предоставленный датасет
  2. Произвести очистку данных от дубликатов
  3. Произвести анализ числовых признаков, выявить выбросы и очистить данные от них
  4. Оценить количество пропусков и оценить возможные методы работы с ними
  5. Отобрать признаки влияющие на ключевой параметр для последюущего включения в модель

⬆️к оглавлению

Результаты:

В результате проведенной работы отобрано 10 признаков, данные очищены от выбросов и получено два датасета для модели с разным методом очистки от пропусков:

  1. с удалением - меньше данных, но они чище
  2. с подстановкой - данных больше, но они менее чистые, тк содержат заглушки, вносящие искажение в исходное распределение

⬆️к оглавлению

Выводы:

При выполнении проекта закреплены навыки работы с pandas DataFrame, графическими библиотеками для построения графиков, а также навыками разведывательного анализа, выбора подходящих для каждого случая графиков, выявление пропусков, выбросов и их очистка.

⬆️к оглавлению

Если информация по этому проекту покажется вам интересной или полезной, то я буду очень вам благодарен, если отметите репозиторий и профиль ⭐️⭐️⭐️-дами

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published