Skip to content

5dash/Bilibili

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

34 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Bilibili网站爬虫


我胖虎今天就是要把b站爬完

File Name Description Remarks
/video.py 视频信息爬取 从av100逐一递增遍历视频信息,并录入数据库
/rank.py 排行榜数据爬取 爬取排行榜数据,可自定义爬取分类以及排行榜时间
/pictures.py 相簿图片爬取 爬取相簿图片,并下载至本地
/member.py 会员信息数据爬取 从id0开始逐一递增,爬取所有会员信息,并录入数据库,但是由于会员数量过于庞大,我试过同时开20个进程同时爬取,但是由于请求过于频繁,ip被封了20来分钟,但是思路已经摆在这了,有ip代理的话问题不大
/audio.py 音频爬取下载 爬取音频专辑id,从12000逐一递增爬取,并将音乐下载至本地
/banned.py 小黑屋数据爬取 从第1页开始逐一递增,爬取所有小黑屋数据,并录入数据库
/column.py 专栏文章爬取 遍历所有专栏分类,并爬取对应专栏下的文章数据(不包含文章内容)录入数据库
/game.py 游戏列表爬取 爬取游戏列表所有数据,录入数据库
/micro_video.py 小视频爬取下载 爬取所有小视频分类下的视频信息,将视频信息录入数据库,将视频下载至本地
functions/database.py Mysql数据库操作相关函数 None
functions/deal_json.py Json数据处理相关函数 None
functions/requests_func.py http请求相关函数 None
functions/thread.py 多线程相关函数 None

个人博客: https://blog.tryfang.cn,欢迎前来交流

About

Bilibili 爬虫合集

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%