Skip to content

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

License

Notifications You must be signed in to change notification settings

eea-uba/EEA-2021

Repository files navigation

EEA-UBA 2021

Ayudantes

Juan Manuel Barriola

Sofía Perini

Clase 1: 21-08

Presentación / Encuesta inicio de curso

Clase 2: 28-08

Fundamentos de programación en R: entorno, objectos, estructuras de datos, loops, control flow y funciones

  • [Introducción al entorno R](clase 1/Clase 1 - Introduccion a R.nb.html)
  • [Loops, condicionales y funciones](clase 1/Clase 1 - Loops, condicionales y funciones.nb.html)
  • [Ejercicios](clase 1/Clase 1 - Ejercicios -Consignas .nb.html)
  • [Resueltos](clase 1/Resueltos/Clase 1 - Ejercicios -Resueltos.R)

Datasets para ejercicios

Clase 3: 04-09

Introducción al paquete Tidyverse: trabajo con datasets (dplyr y tidyr), fechas (lubridate), strings (stringr) y gráficos (ggplot2)

  • [Tidyverse](clase 2/Clase 2 - Tidyverse.nb.html )
  • [Ejercicios](clase 2/Clase 2 - Ejercicios.nb.html )
  • [Resueltos](clase 2/resueltos)

Datasets para ejercicios

Material opcional

  • [Gráficos de kernels y tendencias](clase 2/Clase 2 - Kernels y Tendencias (OPCIONAL).nb.html)
  • [Distintos tipos de Join](clase 2/Clase 2. Distintos tipos de Join (OPCIONAL).nb.html)

Clase 4: 11-09

Estimación y test de correlación entre 2 variables. Matrices de correlación: librerías corrr y GGally

  • [Correlación](clase 3/Clase-3---Correlacion.html)

Análisis exploratorios, limpieza de datos, análisis de outliers e interpretación de los coeficientes de un modelo lineal simple

  • [Regresión Lineal Simple: Modelo e interpretación](clase 3/Clase-3---Regresion-Lineal-Simple.html)

Dataset Notebook Modelo Lineal

Clase 5: 18-09

Inferencia sobre los parámetros, test de significatividad global y R-cuadrado

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Introducción a programación funcional con Tidyverse PURRR

  • [Tidyverse:PURRR](clase 4/PURRR.nb.html)

Clase 6: 25-09

Diagnóstico de modelo lineal simple

  • [Regresión Lineal Simple: Evaluación y diagnóstico](clase 4/Clase-4---Regresion-Lineal-Simple-Eval.html)

Modelo lineal desde el enfoque de Machine Learning: random search y grid search de parámetros, función objetivo y métodos de optimización para hallar los valores de los parámetros

  • [Regresión Lineal Simple: Enfoque de Machine Learning](clase 5/modelo_lineal_enfoque_ml_resuelto.nb.html)

Un ejemplo de Shiny App sobre Overfitting (basado en https://github.com/apapiu/Shiny-Apps)

  • [Shiny App](clase 5/shiny/overfitting/app.R)

Clase 7: 02-10

Interpretación de coeficientes en Regresión Lineal Múltiple, inclusión de variables categóricas y test de significatividad individual

  • [Regresión Lineal Múltiple: Parte I](clase 6/Clase 6 - Regresion Lineal Multiple.nb.html)

Dataset Notebook Modelo Lineal Múltiple

  • Dataset Properati
  • [Preprocesamiento Dataset Properati](clase 6/Preprocesamiento Dataset Properati.nb.html)

Clase 8: 16-10

Evaluación y diagnóstico del modelo. Explicación vs predicción.

  • [Regresión Lineal Múltiple: Parte II](clase 7/Clase 7 - Regresion Multiple II.nb.html)

Dataset Preprocesado Modelo Lineal Múltiple

  • [Datos Properati Preprocesados](clase 6/properati_preprocesado.csv)

Clase 9: 23-10

Extensiones del Modelo de Regresión Lineal Múltiple.

  • [Extensiones Modelo Lineal Múltiple](clase 8/Clase 8 - Molelo log(price).nb.html)

Clase 10: 30-10

Regresión Logística: modelo de clasificación. Interpretación de coeficientes, métricas y gráficos de evaluación del modelo y evaluación de performance.

Problema del desbalanceo de clases: comportamiento del modelo, estrategia de oversampling y su efecto en el modelo

  • [Regresion Logistica](clase 9/logit.nb.html)

Clase 11: 06-11

Regularización: modelos Ridge, Lasso y Elastic Net y trade off sesgo-varianza

  • [Regularizacion: Ridge, Lasso y Elastic Net](clase 10/regularizacion.html)

Datasets para técnicas de regularización

  • [Diccionario de términos NBA](clase 10/diccionario_terminos.csv)
  • [Datos de estádisticas de juego de la NBA](clase 10/ nba_player_stats_salary_2019_2020.csv)

Clase 12: 13-11

Smoothing, GAM y Prophet.

  • [Prophet: implementacion de GAM para series de tiempo](clase 11/prophet_shopping.nb.html)

Clase 13: 27-11

Examen final integrador.

Clase 14: 4-12

Redes Neuronales.

  • [Redes I: Fully Conected Neural Networks](clase 12/mnist101.nb.html)

About

Materiales del curso de Enfoque Estadístico del Aprendizaje de la Maestría de Ciencia de Datos de la Universidad de Buenos Aires.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages