El objetivo de este taller es transferir conocimientos en herramientas de calidad, análisis y visualización interactiva de datos, que le permita a los participantes del webinar de manera ágil, usable y clara, visibilizar el estado de la apertura, completitud y calidad de datos del Instituto Colombiano de Bienestar Familiar. Durante el taller los participantes tendrán un primer acercamiento a herramientas de software libre como Open Refine, Python, Pandas, Matplotlib, Plotly y Folium.
En este repositorio de GitHub encontrará todos los materiales del taller y también recursos adicionales de consulta para profundizar en el uso de las herramientas de software libre.
Los datos abiertos son información pública dispuesta en formatos que permiten su uso y reutilización bajo licencia abierta y sin restricciones legales para su aprovechamiento. En Colombia, la Ley 1712 de 2014 sobre Transparencia y Derecho de Acceso a la Información Pública Nacional, define los datos abiertos en el numeral sexto como "todos aquellos datos primarios o sin procesar, que se encuentran en formatos estándar e interoperables que facilitan su acceso y reutilización, los cuales están bajo la custodia de las entidades públicas o privadas que cumplen con funciones públicas y que son puestos a disposición de cualquier ciudadano, de forma libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados de los mismos".
El ICBF dispone de múltiples conjuntos de datos abiertos, los cuales puede consultar aqui y aquí
Open Refine es una herramienta que nos permite perfilar y limpiar conjuntos de datos. La limpieza de datos es el proceso que intenta corregir errores de forma semiautomática, eliminando espacios en blanco y duplicados, filtrando y facetando filas, agrupando y transformando valores, dividiendo celdas de múltiples valores, entre otros. Algunas herramientas interesantes para seguir aprendiendo sobre la calidad de datos:
- ¿Cómo asignar más memoria para la limpieza de los datos con Open Refine? [https://escueladedatos.online/guia-de-limpieza-de-datos-con-open-refine/]
- Lecciones de uso de Open Refine [https://librarycarpentry.org/lc-open-refine/]
- Guía para la limpieza de datos sobre biodiversidad con OpenRefine [https://docs.gbif.org/openrefine-guide/3.0/es/]
- Kit de video tutoriales para la descarga, instalación y el uso de las principales funcionalidades de Open Refine [https://gobiernodigital.mintic.gov.co/portal/Iniciativas/Software-libre/]
- Manual de usuario de Datos Abiertos para visualizar conjuntos de datos a partir de Socrata
- Repositorio de la Socrata Open Data API (SODA API) para Python que permite la conexión con conjuntos de datos
- Tutorial para descargar Datos Abiertos
- Instructivos básicos de Pandas sobre qué tipos de datos contienen los Dataframes, cómo seleccionar subconjuntos de datos y calcular estadísticas descriptivas