Web Scraping para obtenção dos dados do ambiente Twiki (ambientes que necessitam de autenticação)
Precisei criar esse script para obter os dados de um antigo projeto em um ambiente que necessita de autenticação para acesso às páginas (Twiki). Então, disponibilizo aqui o que fiz. Acredito que será bastante útil para alguém.
- requests: http://docs.python-requests.org/en/master/
- html: https://docs.python.org/3/library/html.parser.html
- BeautifulSoup: https://wiki.python.org.br/BeautifulSoup
- Regex: https://docs.python.org/3/howto/regex.html
- Unicoding: https://docs.python.org/2/library/unicodedata.html
- Numpy: http://numpy.org/