Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Official links to proposals #3

Open
kikito opened this issue Mar 18, 2011 · 11 comments
Open

Official links to proposals #3

kikito opened this issue Mar 18, 2011 · 11 comments

Comments

@jorgegorka
Copy link
Contributor

kilik85 y jorgegorka nos lo asignamos

@cavalle
Copy link
Contributor

cavalle commented Mar 19, 2011

Esto supongo que está relacionado con el scrapper. En su momento me ocupé de esto, si tenéis alguna duda preguntadme

@jorgegorka
Copy link
Contributor

Hemos revisado el scrapping y no vemos ningún problema al ejecutarlo aquí en local ha cogido los datos del enlace correctos.

@jorgegorka
Copy link
Contributor

Cavalle: Vamos a cerrar este ticket. Si se necesita algo más nos comentas.

@cavalle
Copy link
Contributor

cavalle commented Mar 19, 2011

Cierto, en principio parece que funciona. Lo que creo que pasa es el link deja de apuntar a la propuesta que solía según pasan los días. Los que han hecho la web del congreso no deben saber que es un permalink. Si os fijáis la URL tiene pinta de ser el resultado de una búsqueda. Yo creo que codifica algo así como: llevame al segundo resultado de la tercera página de la búsqueda por "Wadus". Superchungo. Y por eso, cuando se añaden nuevas propuestas, el link apunta a otra propuesta.

Es posible que una solución sea asegurarnos de que el scrapping actualiza el link cada vez que se ejecuta. Luego sólo habría que asegurarse de que se ejecuta diariamente.

O quizá podemos intentar encontrar algún otro link que sea permanente.

Así que vuelvo a abrir el issue

@cavalle
Copy link
Contributor

cavalle commented Mar 20, 2011

What's the status of this one? Is it still pending? Should we unassigned it so someone else can pick it up?

@diasjorge
Copy link

I've noticed that the proposals have an identifier like (161/002150)
If we do an advanced search using this identifier it returns only that proposal (according to 5 - 6 manual searches I did)
Based on the result of this search we could use that url since it's not likely that we have more than one result

@diasjorge
Copy link

I've done an initial implementation. The code works fine but the tests are broken. We might need to figure out another way to decouple the test from the implementation

https://gist.github.com/878728

@Canx
Copy link

Canx commented Mar 20, 2011

I would wrap code into an interface and gemify the scrapper in the future (as Luismi issued).
It also could be interesting using vcr cassettes for fixtures: https://github.com/rubymaverick/vcr

@voodoorai2000
Copy link
Member

Ephemeral Response might also be a good gem to test this.

@Canx
Copy link

Canx commented Mar 29, 2011

I'm trying to separate import and scrapping task (and learn ruby doing it, any advice is apreciated!). Code and future gem here ATM: https://github.com/Canx/congress_scrapper

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

6 participants