为寻找工作机会的同胞,提供数据支持 Demo
# :目前项目结构
spider \ # 爬虫部分
__init__.py
config.py # 爬虫配置
spider_util.py # 爬虫类
dataapi.py # 存储类
data_show \ # 数据清洗展示部分
__init__.py
data.py # 从数据库中取出数据
show.py # 生成视图api
log \ # 日志
gunicron.log
gunicron.err
FlyJob \ # web平台
main \ # 主模块
views.py # 主逻辑模块
__init__.py # 蓝图初始化
templates \ # HTML模板目录
index.html # 首页
result.html # 视图生成页面
static\
js \
echarts.js # echarts js库
china.js # 地图js库
worldcloud.js # 词云js库
..
..
css \
..
startapi.py # 对外接口(集合爬虫与存储)
manage.py # 服务器启动文件
__init__.py # 服务器初始化
keyword.json # 数据存储文件
. gitignore # git忽略文件
Pipfile # pipenv 项目库文件
Pipfile.lock # 依赖库文件
supervisor_flyjob.conf # supervisor 配置文件
bootstrap jq (前端ui库)
部署方式:
Nginx+gunicorn+Supervisor+MongoDB+Redis