Skip to content

Commit

Permalink
Fix(join): agrupo por ORCID y me quedo con el mayor valor para cada E…
Browse files Browse the repository at this point in the history
… en un summarise para evitar duplicaciones por variabilidad en registro de nombres
  • Loading branch information
mcnanton committed Sep 24, 2024
1 parent e369fca commit b46de2b
Showing 1 changed file with 14 additions and 1 deletion.
15 changes: 14 additions & 1 deletion R/evaluaciones_cohorte.R
Original file line number Diff line number Diff line change
Expand Up @@ -85,7 +85,7 @@ procesar_forms <- function() {
# Eliminar los registros duplicados para la misma persona en el mismo encuentro
# (si respondieron más de una vez)
Eval <- Eval %>%
distinct(orcid, email, evaluacion, .keep_all = TRUE)
distinct(orcid, email, evaluacion, .keep_all = TRUE)

# Generar planilla con las personas en Eval que no están presentes en datos_inscripcion
# usando ORCID e email.
Expand All @@ -101,6 +101,19 @@ procesar_forms <- function() {
names_from = evaluacion,
values_from = n,
values_fill = list(n = 0)) %>%
group_by(orcid) %>%
summarise(
apellido = first(apellido),
nombre = first(nombre),
email = first(email),
E1 = max(E1),
E2 = max(E2),
E3 = max(E3),
E4 = max(E4),
E5 = max(E5)
) %>%
ungroup() %>%
distinct(.keep_all = TRUE) %>%
rowwise() %>%
mutate(forms_completados = sum(c_across(matches("E\\d"))))

Expand Down

0 comments on commit b46de2b

Please sign in to comment.