Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Implementar scraper para tipos de cambio del BCRA #2

Open
abenassi opened this issue Mar 7, 2019 · 0 comments
Open

Implementar scraper para tipos de cambio del BCRA #2

abenassi opened this issue Mar 7, 2019 · 0 comments
Assignees

Comments

@abenassi
Copy link
Collaborator

abenassi commented Mar 7, 2019

Nombre del scraper: tc-internacional

Desarrollar un módulo en python para scrapear los datos de tipos de cambio de distintas monedas del mundo en 3 CSVs de formato distinto:

CSV en formato de panel (contiene todos los valores de la fuente original)

Posiblidad 1 (más estándar):

  • indice_tiempo
  • moneda (ya tiene transformado "Escudo Portugués" en "escudo_portugues")
  • tipo_tc (tp_usd o tc_local)
  • valor

Posiblidad 2:

  • indice_tiempo
  • moneda
  • tipo_pase_usd
  • tipo_cambio_curso_legal

Nombre del CSV: tipos-cambio-panel.csv

CSV con formato de series de tiempo (ver https://datosgobar.github.io/paquete-apertura-datos/guia-metadatos/#series-de-tiempo): sólo los tipos de pase USD

  • indice_tiempo
  • tp_usd_corona_sueca
  • tp_usd_dolar_australiano
  • tp_usd_lira_italiana
    ...

Nombre del CSV: tipos-pase-usd-series.csv

CSV con formato de series de tiempo (ver https://datosgobar.github.io/paquete-apertura-datos/guia-metadatos/#series-de-tiempo): sólo los tipos de cambio de moneda de curso legal

  • indice_tiempo
  • tc_local_corona_sueca
  • tc_local_dolar_australiano
  • tc_local_lira_italiana
    ...

Nombre del CSV: tipos-cambio-local-series.csv

Fuente original: http://www.bcra.gov.ar/PublicacionesEstadisticas/Evolucion_moneda.asp

Notas:

  • El nombre del campo de una serie debe formarse por la raíz ("tc_local" o "tp_usd") y la conversión a minúsculas ASCII con palabras separadas por "_" del nombre de la moneda en el selector. Así "Dolar Australiano" pasa a ser "dolar_australiano"
  • Ningún nombre de campo puede superar los 60 caracteres completo, si lo supera hay que truncarlo
  • Tanto las raíces como el diccionario de traducción entre el nombre original y el convertido, deben estar parametrizadas de forma tal que sea fácil modificarlas y generar el CSV nuevamente con nuevos nombres
  • Debe ser posible generar el CSV nuevamente sin scrapear el sitio web necesariamente (es decir, separar los pasos de extracción, de transformación y que se puedan correr por separado).
  • Los nombres de los archivos CSV deben estar parametrizados también para que sea fácil cambiarlos
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants