Skip to content

Latest commit

 

History

History
11 lines (10 loc) · 574 Bytes

README.md

File metadata and controls

11 lines (10 loc) · 574 Bytes

热门微博爬虫+词云

新浪热门微博爬虫,外加词云分析。
用到的第三方库:

  1. bs4
  2. requests
  3. opencv———或者用pil+numpy也可,网上代码大多采用这种组合。
  4. jieba分词
  5. wordcloud。如果Windows安装困难可在词云下载whl然后pip。

**且爬且珍惜……**微博反爬虫机制会不定时响应超时,甚至拒绝响应。
生成的word Cloud