epiverse-trace · GeraldineGomez · May 10, 2024 · May 7, 2024 · May 7, 2024 · May 7, 2024
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -38,8 +38,6 @@ Imports:
     readxl,
     sysfonts,
     showtext,
-    cowplot,
-    gridExtra,
     kableExtra
 Suggests: 
     knitr,

diff --git a/NAMESPACE b/NAMESPACE
@@ -7,15 +7,14 @@ export(agrupar_edad)
 export(agrupar_edad_sex)
 export(agrupar_eventos)
 export(agrupar_fecha_inisintomas)
-export(agrupar_fecha_notifica)
 export(agrupar_mpio)
 export(agrupar_per_etn)
-export(agrupar_pob_especial)
 export(agrupar_rango_edad)
 export(agrupar_semanaepi)
 export(agrupar_sex)
 export(agrupar_sex_semanaepi)
 export(agrupar_tipo_caso)
+export(agrupar_top_area_geo)
 export(agrupar_years)
 export(calcular_incidencia)
 export(calcular_incidencia_geo)
@@ -34,7 +33,6 @@ export(limpiar_fecha_event)
 export(limpiar_val_atipic)
 export(list_events)
 export(listar_dptos)
-export(obtener_casos_pob_especial)
 export(obtener_cond_inciden_event)
 export(obtener_dptos)
 export(obtener_estetica_escala)
@@ -49,7 +47,6 @@ export(plot_dptos)
 export(plot_edad)
 export(plot_edad_sex)
 export(plot_fecha_inisintomas)
-export(plot_fecha_notifica)
 export(plot_map)
 export(plot_mpios)
 export(plot_per_etn)
@@ -60,6 +57,7 @@ export(plot_tabla_incidencia_sex)
 export(plot_tabla_tipos_event)
 export(plot_tipo_caso)
 export(plot_tipo_caso_years)
+export(plot_top_area_geo)
 export(plot_years)
 export(remove_error_fecha)
 export(remove_val_nin)

diff --git a/R/checking_data.R b/R/checking_data.R
@@ -128,6 +128,14 @@ agrupar_semanaepi <- function(data_event,
 #' @param porcentaje Un `boolean` (TRUE o FALSE) que indica
 #' si se debe agregar una columna con el porcentaje de casos;
 #' su valor por defecto es `FALSE`
+#' @param estandar Un `boolean` (TRUE o FALSE) que indica
+#' si se debe utilizar el estandar de agrupación de los datos
+#' del evento o enfermedad propuesto por el paquete, es decir
+#' que se incluyan estas columnas o variables como parte del
+#' resultado `c("cod_eve", "nombre_evento", "ano")`; su valor
+#' por defecto es `TRUE`, si su valor es `FALSE` agrupara los
+#' datos solamente por las columnas o variables enviadas en el
+#' párametro `nomb_cols`
 #' @return Un `data.frame` con los datos de una enfermedad
 #' o evento agrupados por el nombre de la(s) columna(s) y el
 #' número de casos
@@ -142,7 +150,8 @@ agrupar_semanaepi <- function(data_event,
 #' @export
 agrupar_cols_casos <- function(data_event,
                                nomb_cols,
-                               porcentaje = FALSE) {
+                               porcentaje = FALSE,
+                               estandar = TRUE) {
   stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
             "El parametro data_event debe ser un data.frame" =
               is.data.frame(data_event),
@@ -156,17 +165,23 @@ agrupar_cols_casos <- function(data_event,
               (!is.character(nomb_cols) && is.array(nomb_cols)),
             "El parametro porcentaje debe ser un booleano (TRUE o FALSE)" =
               is.logical(porcentaje))
-  nomb_cols <- append(nomb_cols, c("cod_eve", "nombre_evento", "ano"))
-  data_event_agrupada <- data_event %>%
-    dplyr::group_by_at(nomb_cols) %>%
-    dplyr::summarise(casos = dplyr::n(), .groups = "drop")
+  if (estandar) {
+    nomb_cols <- append(nomb_cols, c("cod_eve", "nombre_evento", "ano"))
+    data_event_agrupada <- data_event %>%
+      dplyr::group_by_at(nomb_cols) %>%
+      dplyr::summarise(casos = dplyr::n(), .groups = "drop")
+  } else {
+    data_event_agrupada <- data_event %>%
+      dplyr::group_by_at(nomb_cols) %>%
+      dplyr::summarise(casos = sum(.data[["casos"]]), .groups = "drop")
+  }
   if (porcentaje) {
     data_event_agrupada <-
       data_event_agrupada %>%
       dplyr::mutate(porcentaje =
                     round(data_event_agrupada$casos
                           / sum(data_event_agrupada$casos) * 100,
-                          1))
+                          2))
   }
   return(data_event_agrupada)
 }
@@ -283,46 +298,6 @@ agrupar_fecha_inisintomas <- function(data_event,
   return(data_agrupada_fecha_ini)
 }
 
-#' Agrupar por fecha de notificación y casos
-#'
-#' Función que agrupa los datos de una enfermedad o evento por fecha de
-#' notificación y número de casos
-#' @param data_event Un `data.frame` que contiene los datos de la enfermedad
-#' o evento
-#' @param col_fecha Un `character` (cadena de caracteres) con el nombre de
-#' la columna que contiene las fechas de notificación en los datos de la
-#' enfermedad o evento; su valor por defecto es `"fec_not"`
-#' @return Un `data.frame` con los datos de enfermedades agrupados por fecha de
-#' notificación y número de casos
-#' @examples
-#' data(dengue2020)
-#' data_limpia <- limpiar_data_sivigila(data_event = dengue2020)
-#' agrupar_fecha_notifica(data_event = data_limpia,
-#'                        col_fecha = "fec_not")
-#' @export
-agrupar_fecha_notifica <- function(data_event,
-                                   col_fecha = "fec_not") {
-  fechas_cols_nombres <- config::get(file =
-                                       system.file("extdata",
-                                                   "config.yml",
-                                                   package = "sivirep"),
-                                     "dates_column_names")
-  stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
-            "El parametro data_event debe ser un data.frame" =
-              is.data.frame(data_event),
-            "El parametro data_event no debe estar vacio" =
-              nrow(data_event) > 0)
-  if (is.null(col_fecha)) {
-    col_fecha <- fechas_cols_nombres[2]
-  }
-  stopifnot("El parametro col_fecha debe ser una cadena de caracteres"
-            = is.character(col_fecha))
-  nomb_cols <- append(col_fecha, "semana")
-  data_agrupada_fecha_not <- agrupar_cols_casos(data_event,
-                                                nomb_cols = nomb_cols)
-  return(data_agrupada_fecha_not)
-}
-
 #' Agrupar por sexo y casos
 #'
 #' Función que agrupa los datos de una enfermedad o evento
@@ -507,47 +482,6 @@ agrupar_edad_sex <- function(data_event,
   return(data_event_edad_sex)
 }
 
-#' Agrupar por población especial y casos
-#'
-#' Función que agrupa los datos de la enfermedad o evento por población
-#' especial y casos
-#' @param data_event Un `data.frame` que contiene los datos de la enfermedad
-#' o evento
-#' @param col_pob Un `character` (cadena de caracteres) con el nombre de la
-#' columna que contiene las poblaciones especiales en los datos de la
-#' enfermedad o evento; su valor por defecto es `"poblacion"`
-#' @param porcentaje Un `boolean` (TRUE o FALSE) que indica si se debe
-#' agregar una columna con el porcentaje de casos; su valor por
-#' defecto es `FALSE`
-#' @return Un `data.frame` con los datos de la enfermedad o evento agrupados
-#' por poblaciones especiales y casos
-#' @examples
-#' data(dengue2020)
-#' data_limpia <- limpiar_data_sivigila(data_event = dengue2020)
-#' agrupar_pob_especial(data_event = data_limpia,
-#'                      col_pob = "poblacion",
-#'                      porcentaje = TRUE)
-#' @export
-agrupar_pob_especial <- function(data_event,
-                                 col_pob = "poblacion",
-                                 porcentaje = TRUE) {
-  stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
-            "El parametro data_event debe ser un data.frame" =
-              is.data.frame(data_event),
-            "El parametro data_event no debe estar vacio" =
-              nrow(data_event) > 0,
-            "El parametro col_pob debe ser una cadena de caracteres"
-            = is.character(col_pob),
-            "El parametro porcentaje debe ser un booleano (TRUE o FALSE)" =
-              is.logical(porcentaje))
-  data_event_especial <- obtener_casos_pob_especial(data_event)
-  data_event_especial_agrupada <- data.frame(poblacion =
-                                               data_event_especial$poblacion,
-                                             casos =
-                                               data_event_especial$casos)
-  return(data_event_especial_agrupada)
-}
-
 #' Agrupar por departamento y casos
 #'
 #' Función que agrupa los datos por códigos de departamento y
@@ -674,6 +608,46 @@ agrupar_mpio <- function(data_event,
 #' Agrupar por área geográfica
 #'
 #' Función que agrupa los datos de una enfermedad o evento por área
+#' geográfica
+#' @param data_event Un `data.frame` que contiene los datos de la
+#' enfermedad o evento
+#' @param col_area Un `character` (cadena de caracteres) con el nombre de
+#' la columna que contiene las áreas geográficas en los datos de la enfermedad
+#' o evento; su valor por defecto es `"area"`
+#' @param porcentaje Un `boolean` (TRUE o FALSE) que indica si se debe
+#' agregar una columna con el porcentaje de casos; su valor por
+#' defecto es `FALSE`
+#' @return Un `data.frame` con los datos de la enfermedad o evento agrupados
+#' por área geográfica
+#' @examples
+#' data(dengue2020)
+#' data_limpia <- limpiar_data_sivigila(data_event = dengue2020)
+#' agrupar_area_geo(data_event = data_limpia,
+#'                  col_area = "area",
+#'                  porcentaje = FALSE)
+#' @export
+agrupar_area_geo <- function(data_event,
+                             col_area = "area",
+                             porcentaje = FALSE) {
+  stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
+            "El parametro data_event debe ser un data.frame" =
+              is.data.frame(data_event),
+            "El parametro data_event no debe estar vacio" =
+              nrow(data_event) > 0,
+            "El parametro col_area debe ser una cadena de caracteres"
+            = is.character(col_area),
+            "El parametro porcentaje debe ser un booleano (TRUE o FALSE)" =
+              is.logical(porcentaje))
+  data_event_area <- agrupar_cols_casos(data_event,
+                                        col_area)
+  data_event_area <- dplyr::arrange(data_event_area,
+                                    dplyr::desc(.data$casos))
+  return(data_event_area)
+}
+
+#' Agrupar por área geográfica a nivel departamental o municipal
+#'
+#' Función que agrupa los datos de una enfermedad o evento por área
 #' geográfica a nivel departamental o municipal
 #' @param data_event Un `data.frame` que contiene los datos de la
 #' enfermedad o evento
@@ -690,20 +664,25 @@ agrupar_mpio <- function(data_event,
 #' @param porcentaje Un `boolean` (TRUE o FALSE) que indica si se debe
 #' agregar una columna con el porcentaje de casos; su valor por
 #' defecto es `FALSE`
+#' @param top Un `numeric` (numerico) que indica la cantidad de departamentos o
+#' municipios con mayor número de casos que se deben retornar; su valor
+#' por defecto es `10`
 #' @return Un `data.frame` con los datos de la enfermedad o evento agrupados
 #' por códigos de municipios y número de casos
 #' @examples
 #' data(dengue2020)
 #' data_limpia <- limpiar_data_sivigila(data_event = dengue2020)
-#' agrupar_area_geo(data_event = data_limpia,
-#'                  dpto = "Antioquia",
-#'                  col_area = "area",
-#'                  porcentaje = FALSE)
+#' agrupar_top_area_geo(data_event = data_limpia,
+#'                      dpto = "Antioquia",
+#'                      col_area = "area",
+#'                      porcentaje = FALSE,
+#'                      top = 10)
 #' @export
-agrupar_area_geo <- function(data_event,
+agrupar_top_area_geo <- function(data_event,
                              dpto = NULL,
                              col_area = "area",
-                             porcentaje = FALSE) {
+                             porcentaje = FALSE,
+                             top = 10) {
   stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
             "El parametro data_event debe ser un data.frame" =
               is.data.frame(data_event),
@@ -721,18 +700,19 @@ agrupar_area_geo <- function(data_event,
       if (length(aux_dpto) > 1) {
         data_event_area <- geo_filtro(data_event, dpto)
       }
-      data_event_area <- agrupar_cols_casos(data_event_area,
-                                            nomb_cols)
   } else {
     dpto <- unique(data_event_area[[nomb_cols[3]]])
     if (length(dpto) != 1) {
       nomb_cols <- nomb_cols[1:3]
     }
-    data_event_area <- agrupar_cols_casos(data_event_area,
-                                          nomb_cols)
   }
+  data_event_area <- agrupar_cols_casos(data_event_area,
+                                        nomb_cols)
   data_event_area <- dplyr::arrange(data_event_area,
                                     dplyr::desc(.data$casos))
+  if (top <= nrow(data_event_area)) {
+    data_event_area <- data_event_area[1:top, ]
+  }
   return(data_event_area)
 }
 
@@ -842,6 +822,9 @@ agrupar_tipo_caso <- function(data_event, cols_tipo = "tip_cas") {
 #' @param cols_etn Un `character` (cadena de caracteres) con el nombre de
 #' las columna(s) que contiene(n) la pertenencia étnica en los datos de la
 #' enfermedad o evento; su valor por defecto es `"per_etn"`
+#' @param porcentaje Un `boolean` (TRUE o FALSE) que indica
+#' si se debe agregar una columna con el porcentaje de casos;
+#' su valor por defecto es `TRUE`
 #' @return Un `data.frame` con los datos de la enfermedad o evento agrupados
 #' por la pertenencia étnica
 #' @examples
@@ -850,7 +833,8 @@ agrupar_tipo_caso <- function(data_event, cols_tipo = "tip_cas") {
 #' agrupar_per_etn(data_event = data_limpia,
 #'                 cols_etn = "per_etn")
 #' @export
-agrupar_per_etn <- function(data_event, cols_etn = "per_etn") {
+agrupar_per_etn <- function(data_event, cols_etn = "per_etn",
+                            porcentaje = TRUE) {
   stopifnot("El parametro data_event es obligatorio" = !missing(data_event),
             "El parametro data_event debe ser un data.frame" =
               is.data.frame(data_event),
@@ -868,7 +852,8 @@ agrupar_per_etn <- function(data_event, cols_etn = "per_etn") {
                            "labels_per_etn")
   etiquetas <- unlist(etiquetas)
   data_event_tipo <- agrupar_cols_casos(data_event,
-                                        nomb_cols = cols_etn)
+                                        nomb_cols = cols_etn,
+                                        porcentaje = porcentaje)
   data_event_tipo <- data_event_tipo %>%
     dplyr::mutate(nombre_per_etn =
                     etiquetas[as.character(.data[[cols_etn[1]]])])